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55 (54) Titre: UTILISATION D'UN POLYPEPTIQUE POUR DETECTER, PREVENIR OU TRAITER UN ETAT PATHOLOGIQUE 
= ASSOCIE A UNE MALADIE DEGENERATIVE, NEUROLOGIQUE AUTOIMMUNE 

=~ (57) Abstract: The invention concerns the use of at least one polypeptide comprising a protein fragment to obtain a diagnostic, 
prognostic, prophylactic or therapeutic composition for detecting, preventing or treating a pathological condition associated with a 
55 degenerative and/or neurological and/or autoimmune disease, said protein being selected among the proteins whereof the peptide 
= sequence in native state corresponds to SEQ ID No 1, SEQ ID No 2, SEQ ID No 3, SEQ ID No 4, SEQ ID No 5, SEQ ID No 6, 
HH SEQ ID No 7, SEQ ID No 8, SEQ ID No 9, SEQ ID No 10, SEQ ID No 1 1, SEQ ID No 12, SEQ ID No 13, SEQ ID No 14, SEQ 
10 No 15, SEQ ID No 16, SEQ ID No 17, SEQ ID No 18, SEQ ID No 19, SEQ ID No 20, SEQ ID No 21, SEQ ID No 22, SEQ 
g ID No 23, SEQ ID No 24, SEQ ID No 25, SEQ ID No 26, SEQ ID No 27, SEQ ID No 28 and SEQ ID No 29, and the peptide 
sequences having at least 70 % identity, preferably at least 80 % identity and advantageously at least 98 % identity with any one of 
the peptide sequences SEQ ID No 1 to SEQ ID No 8 and SEQ ID No 10 to SEQ ED No 29, and the peptide sequences or fragments 
of said sequences belonging to a common family of proteins selected among perlecan, the precursor of the retinol-binding plasmatic 
^ protein, of the precursor of the activator of GM2 ganglioside, of calgranulin B and of saponin B. 

< 

(57) Abrege: Utilisation d'au moins un polypeptide comprenant au moins un fragment d*une protelne pour obtenir une composition 
f^l diagnostique, pronostique, prophylactique ou therapeutique destinee a detecter, prevenir ou trailer un etat pathologique associd a 

une maladie degenerative et/ou neurologique et/ou auto-immune, ladite protelne e*tant cboisie parmi les protfiines dont la sequence 
5" peptidique k l'&at natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5. SEQ ID N° 6, SEQ 
^ IDN°7,SEQIDN , 8,SEQIDN 0 10, SEQ ID N° 11, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 

16, SEQ ID N° 17,SEQn>N° I8,SEQH>N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, 
^ SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29, et les sequences peptidiques qui presentent au moins 

70 % d'identite*, de preference au moins 80 % d'identite* et avantageusement au moins 98 % d'identite* avec Tune quelconque des 
O sequences peptidiques SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID N° 10 a SEQ ID N° 29, et les sequences peptidiques ou les fragments 

desdites sequences appartenant a une meme famille de protCines choisies parmi le perlecan, le precurseur de la proteine plasmatique 
^ de liaison au re*tinol, du precurseur de l'activateur du ganglioside GM2, de la calgranuline B et de la saposine B. 
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UTILISATION DUN POLYPEPTIDE POUR DETECTER, PREVENIR OU 
TRAITER UN ETAT PATHOLOGIQUE ASSOCIE A UNE MALADIE 
DEGENERATIVE, NEUROLOGIQUE AUTOIMMUNE 

5 La presente invention concerne notamment Futilisation d'au moins un 

polypeptide, pour obtenir une composition diagnostique, pronostique, prophylactique 
ou therapeutique destinee a detecter, prevenir ou traiter un etat pathologique associe a 
une maladie degenerative et/ou auto-immune et/ou neurologique. 

Selon 1* invention, on entend par maladie degenerative, une maladie dans 

10 laquelle un processus de mort cellulaire ou de destruction cellulaire est associe a des 
troubles physiologiques et/ou cliniques. La maladie d'Alzheimer, la sclerose laterale 
amyotrophique, la maladie de Parkinson sont classees parmi les maladies 
neurodegeneratives. On entend par maladie auto-immune, une hyperreactivite du 
systeme immunitaire vis a vis d'un ou de plusieurs auto-antigene(s). La sclerose en 

15 plaques (SEP), la polyarthrite rhumatoide (PR) et le lupus erythemateux sont classes 
dans les maladies auto-immunes. 

La sclerose en plaques est une maladie chronique du systeme nerveux 
central de Fhomme, evoluant par succession de phases de remission et de poussee ou 
selon une progression reguliere, dont la caracteristique anatomopathologique consiste 

20 en la formation de zones de demyelinisation bien delimitees dans la substance blanche 
du cerveau et de la moelle epiniere. 

Au niveau histologique, ces zones presentent au stade precoce du 
processus lesionnel, une degradation de la myeline peri-axonale associee a une atteinte 
des cellules gliales responsable de cette demyelinisation. Une activation 

25 macrophagique inflammatoire impliquant les cellules microgliales (macrophages 
tissulaires residants du systeme nerveux central), ainsi que, probablement, des 
macrophages provenant de monocytes sanguins infiltres, est associee a ce processus de 
demyelinisation et contribue a la destruction des feuillets myelinises. Au centre de la 
zone demyelinisee, une depletion relative en cellules gliales est retrouvee alors qu'une 

30 proliferation d'astrocytes se developpe a la peripheric et peut envahir la plaque 
demyelinisee pour generer une plaque fibreuse ou gliotique. Ces structures sclerotiques 
sont a Torigine du nom donne a la maladie. 
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Une autre caracteristique de ces plaques est leur association quasi 
systematique avec un element vasculaire autour duquel elles se developpent. 

Au niveau histologique, on observe une alteration frequente de la barriere 
hemato-encephalique (BHE) constitute par V endothelium capillaire. Un des elements 
5 determinants dans le maintien de la BHE est constitue par la presence sous-jacente 
d'extensions cytoplasmiques des astrocytes, appelees pieds astrocytaires. 
Vraisemblablement, les pieds astrocytaires induisent la formation ou permettent le 
maintien de structures de jonction etanches qui assurent la cohesion de la barriere 
endothelial capillaire concretisant la BHE. Or, differents modeles pathologiques font 
10 etat de l'alteration de la BHE et d'une depletion des pieds astrocytaires. 

Par ailleurs, dans le processus lesionnel de la SEP, l'alteration de la BHE 
contribue a amplifier la reponse inflammatoire associee, par F afflux de cellules 
lymphoides provenant de la circulation sanguine. La contribution de rinflammation 
associee aux cellules immunitaires est importante dans la SEP et participe au processus 
15 lesionnel. 

L'etiologie de la SEP est source d'un debat d'actualite car la maladie 
pourrait avoir des origines diverses. Des hypotheses ont ete emises sur une origine 
bacterienne et/ou virale. Par ailleurs, comme decrit dans la demande de brevet 
WO 95/21859, H. Perron et al. ont ete conduits a rechercher un ou des agents effecteurs 

20 du processus pathogenique aboutissant a la formation typique de plaques de 
demyelinisation et a une gliose astrocytaire. Dans le cadre de cette etude, ils ont mis en 
evidence la presence dans le liquide cephalo-rachidien (LCR) et le serum de patients 
SEP d'au moins un facteur qui presente une activite toxique vis a vis des cellules 
astrocytaires et oligodendrocytaires humaines ou animales. Cette activite toxique se 

25 caracterise par une disorganisation cytomorphologique du reseau de filaments 
intermediaires et/ou une degradation des proteines desdits filaments et/ou une mort 
cellulaires par apoptose des cellules gliales. Ils ont etabli une correlation significative 
entre la detection in vitro de cette activite toxique dans des echantillons de LCR et de 
serum de patients SEP et la sclerose en plaques par un dosage colorimetrique 

30 quantitatif au bromure de methylt&razolium (MTT) des cellules vivantes, comme 
decrit dans la demande de brevet WO 95/21859. Par ailleurs, C. Malcus-Vocanson et 
al. ont montre que Turine est un fluide biologique tres favorable pour la detection de 
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l'activite de ce facteur toxique et developpe un procede utilisant la cytometric de flux 
pour detecter et/ou quantifier les cellules gliales adherentes mortes par apoptose. 
Toutes les informations concernant ce procede sont decrites dans la demande de brevet 
WO 98/1 1439, dont le contenu est incorpore a titre de reference. 
5 Des essais ont ete realises a partir d'une fraction proteique de LCR et 

d'urine de patients SEP pour tenter d'identifier ce facteur toxique. Le contenu 
proteique de chaque fraction a ete separe sur gel SDS-PAGE 12 % et observe apres 
coloration du gel a I'argent. Parmi les proteines observees, une fraction proteique 
centree sur un poids moleculaire apparent d'environ 21 kD a ete trouvee 

10 minoritairement associee a P activite toxique detectee in vitro et une fraction centree sur 
un poids moleculaire apparent d'environ 17 kD a ete trouvee majoritairement associee 
a cette activite toxique. 

Une injection de la fraction provenant de LCR de patients SEP dans le 
cerveau de rat Lewis et une observation histologique post-mortem de coupes de 

15 cerveau des rats a permis d'observer, trois mois apres 1'injection, une apoptose de la 
population astrocytaire et la formation de plaques de demyelinisation. Toutes les 
informations sont contenues dans la demande de brevet WO 97/33466, dont le contenu 
est incorpore a titre de reference. Ces observations sont conformes a celles qui ont pu 
etre faites sur des coupes de cerveau de patients atteints de SEP, apres biopsie (N. 

20 Benjelioun et al. Cell. Mol. Biol., 1998, 44 (4), 579-583). 

Les presents inventeurs ont maintenant identifie et analyse les proteines 
associees a cette activite toxique vis a vis des cellules gliales dans des echantillons 
biologiques de patients SEP, en particulier dans Purine, le liquide cephalo-rachidien et 
le serum. 

25 Apres purification des proteines et separation sur gel SDS-TRICINE, les 

inventeurs ont mis en evidence la presence de quatre bandes d'interet de differents 
poids moleculaires apparents, respectivement de 8, 14, 18 et 20 kD correspondant a au 
moins cinq families de proteines differentes. Les proteines de ces families ont ensuite 
ete analysees par spectrometrie de masse et/ou sequen^age et recherche d'homologie 

30 dans les banques de donnees (NCBI http :/ww.ncbi.nlm.nih.gov, Basic Blast Search, 
Protein Blastp, les sequences proteiques sont entrees en format FASTA dans la base de 
donnees nr, Talgorithme utilise est Matrix BLOSUM62, Tidentite denommee 
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" Identities " correspond au nombre d'acides amines identiques donne en pourcentage 
et la positivite " Positives " correspond aux acides amines presentant une equivalence 
biologique selon les parametres susmentionnes du logiciel donnes en pourcentage). Ces 
proteines appartiennent aux families des proteines du Perlecan, du precurseur de la 
5 proteine plasmatique de liaison au retinol, du precurseur de l'activateur du ganglioside 
GM2, de la calgranuline et de la saposine B. Plus precisement, les proteines sont (i) 
pour la bande de 20 kD le fragment C-terminal du Perlecan qui commence a l'acide 
amine 3464 et se termine a l'acide amine 3707 (Murdoch AD et ah J Biol Chem, 1992, 
April 25 ;267 (12) :8544-47), et reference dans Tidentificateur de sequences SEQ ID 

10 N° 2 (la proteine entiere Perlecan etant referencee en SEQ ID N°l), (ii) pour la bande 
de 20 kD le precurseur de la proteine plasmatique de liaison au retinol (Monaco HL et 
al., Science, 1995, 268 (5213) :1039-1041) dont la sequence est donnee en SEQ ID N° 
4, (iii) pour la bande de 18 kD le precurseur de l'activateur du ganglioside GM2 (Furst 
W et ah, Euro J Biochem, 1990, Sep 24 ; 193(3) :709-14) identifie en SEQ ID N° 8, 

15 (iv) pour la bande de 14 kD la calgranuline B (Lagasse. E et al., Mol Cell Biol, 1988, 
Jun ;8(6) :2402-10) identifiee en SEQ ID N° 17 et (v) pour la bande de 8 kD la 
saposine B (Kleinschmidt T et al, Biol Chem Hoppe Seyler, 1988, Dec ;369(12) :1361- 
5> representee en SEQ ID N° 24. lis ont par ailleurs mis egalement en evidence la 
presence de sequences variantes auxdites sequences de reference, en particulier pour la 

20 bande de 18 kD une sequence variante du precurseur de Pactivateur du ganglioside 
GM2 referencee SEQ ID N° 9. Ces sequences proteiques variantes sont le produit de 
mutations au niveau des genes codant pour lesdites proteines ou sont le resultats de 
phenomenes d'epissage. II est a noter par exemple que la calprotectine est un variant de 
la calgranuline B. 

25 Le fragment C-terminal de la proteine Perlecan (SEQ ID N° 2) est codee 

par exemple par la sequence nucleotidique ADN SEQ ID N° 69, en tenant compte du 
code genetique. La proteine precurseur de la proteine plasmatique de liaison au retinol 
(SEQ ID N° 4) est codee par exemple par la sequence nucleotidique ADN SEQ ID 
N° 70, en tenant compte du code genetique. La proteine activatrice du GM2 (SEQ ID 

30 N° 8) est codee par exemple par la sequence nucleotidique ADN SEQ ID N° 31, en 
tenant compte du code genetique. Les peptides FSWDNCFEGK DPAVIR et YSLPKSEFAV 
PDLELP issus du polypeptide mute activateur du GM2 (SEQ ID N°9) sont codes par les 
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sequences nucleotidiques ADN SEQ ID N° 66 et SEQ ID N° 67 respectivement, en 
tenant compte du code genetique. La proteine calgranuline B (SEQ ID N° 17) est codee 
par exemple par la sequence nucleotidique ADN SEQ ID N° 42, en tenant compte du 
code genetique. La proteine saposine B (SEQ ID N° 24) est codee par exemple par la 
5 sequence nucleotidique ADN SEQ ID N° 53, en tenant compte du code genetique. 

Par famille de proteines on entend l'ensemble des proteines codees a partir 
d'un meme gene d'ADN et qui resultent d'un multi-epissage differentiel du gene et/ou 
d'un cadre de lecture different. Le gene ADN est transcrit avec des phenomenes 
d'epissage altematif ce qui conduit a la traduction de differentes sequences primaires 
10 de proteines. Toutes ces proteines appartiennent a une meme famille proteique. On 
inclut egalement dans le terme " famille proteique ", les proteines qui presentent au 
moins 70% d'identite, de preference au moins 80 % d'identite et avantageusement au 
moins 98 % d'identite avec une sequence proteique de reference de la famille. 

On entend par multi-epissage, un epissage intervenant au moins une fois 
1 5 dans la region nucleotidique d'interet. 

Par exemple, par famille de proteine precurseur de la proteine plasmatique 
de liaison au retinol, on designe la famille de proteines comprenant au moins les 
proteines ou fragment de proteines de sequence SEQ ID N° 4, SEQ IDN° 5, SEQ ID 
N° 6, SEQ ED N° 7, et les proteines codees par le gene correspondant selon differents 
20 cadres de lecture. 

Par exemple, par famille de proteine activatrice du GM2, on designe la 
famille de proteines comprenant au moins les proteines ou fragments de proteines de 
sequence SEQ ID N° 8, SEQ ID N° 9, SEQ ID N° 10, SEQ ID N° 1 1, SEQ ID N° 12, 
SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, et les proteines codees 
25 par le gene correspondant selon differents cadres de lecture, qui resultent d'un multi- 
epissage differentiel du gene et/ou d'un cadre de lecture different. 

Par exemple, par famille de proteine calgranuline B, on designe la famille 
de proteines comprenant au moins les proteines ou fragments de proteines de sequence 
SEQ ID N° 17, SEQ ED N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ED 
30 N° 22, SEQ ID N° 23, et les proteines codees par le gene correspondant selon differents 
cadres de lecture, qui resultent d'un multi-epissage differentiel du gene et/ou d'un 
cadre de lecture different. Les proteines MRP 14 (SEQ ID N° 17) et MRP8 (SEQ ID N° 
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1 8) ont une sequence proteique differente tout en etant codees par un meme gene ; elles 
appartiennent a la meme famille proteique. 

Par exemple, par famille de proteine saposine B, on designe la famille de 
proteines comprenant au moins les proteines ou fragments de proteines de sequence 
5 SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID N° 28, SEQ 
IDN° 29, et les proteines codees par le gene correspondant selon differents cadres de 
lecture, qui resultent d'un multi-epissage differentiel du gene et/ou d'un cadre de 
lecture different. 

Par famille d'acides nucleiques codant pour une proteine on entend 
10 V ensemble des sequences nucleiques ADNc et/ou ARN transcrits a partir d'un meme 
gene ADN et, qui resultent d'un multi-epissage differentiel. Le gene ADN est transcrit 
avec des phenomenes d'epissage differentiels et conduit a la synthese de differents 
acides nucleiques (ADNc, ARN) de sequences differentes. Toutes ces sequences ADNc 
et ARNm sont considerees comme appartenant a une meme famille d'acides 
15 nucleiques. 

Par exemple, par famille d'acides nucleiques codant pour la famille de 
proteine precurseur de la proteine plasmatique de liaison au retinol, on designe la 
famille d'acides nucleiques comprenant au moins les acides nucleiques ou fragments de 
sequence SEQ ID N°30. 

20 Par exemple, par famille d'acides nucleiques codant pour la famille de 

proteine activatrice du GM2, on designe la famille d'acides nucleiques comprenant au 
moins les acides nucleiques ou fragments de sequences SEQ ID N° 1L SEQ ID N° 32, 
SEQ ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID N° 36, SEQ ID N° 37, SEQ ED 
N° 38, SEQ ID N° 39, SEQ ID N° 40, SEQ ID N° 41 qui resultent d'un multi-epissage 

25 differentiel du gene et/ou d'un cadre de lecture different. 

Par exemple, par famille d'acides nucleiques codant pour la famille de 
proteine calgranuline B, on designe la famille d'acides nucleiques comprenant au 
moins les acides nucleiques ou fragments de sequences SEQ ID N° 42, SEQ ID N° 43, 
SEQ ID N° 44, SEQ ID N° 45, SEQ ID N° 46, SEQ ID N° 47, SEQ ID N° 48, SEQ ID 

30 N° 49, SEQ ED N° 50, SEQ ID N° 5 1, SEQ ID N° 52 qui resultent d'un multi-epissage 
differentiel du gene et/ou d'un cadre de lecture different. 
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Par exemple, par famille d'acides nucleiques codant pour la famille de 
proteine saposine B, on designe la famille d'acides nucleiques comprenant au moins les 
acides nucleiques ou fragment de sequences SEQ ID N° 53, SEQ ID N° 54, SEQ ID N° 
55 qui resultent d'un multi-epissage differentiel du gene et/ou d'un cadre de lecture 
5 different. 

Par « epissage » on entend un mecanisme d'excision des introns et de 
raboutage des exons au cours de la maturation des transcrits et par "epissage 
differentiel " on entend P existence de plusieurs schemas d'epissage d'un transcrit 
primaire aboutissant a la formation de differents ARN messagers et, pouvant donner 

10 lieu a la synthese de plusieurs proteines differentes (Kaplan et Delpech, Biologie 
Moleculaire et Medecine, 1993, 2*"* edition, Medecine et Sciences, Fiammarion, pages 
73-77). CE phenomene est largement decrit dans la Iitterature scientifique. A titre 
d'exemple, on peut citer le modele des genes qui codent pour les chaines lourdes et 
legeres des immunoglobulines, le modele du gene de la dystrophine, le modele du gene 

15 de F alpha amylase, le gene de la myeline, etc... 

II est connu que les genes eucaryotes, notamment, comprennent des 
regions (exons) qui codent pour des fragments de la proteine codee par ledit gene et 
d'autres regions (introns) qui n'ont pas d'equivalent proteique. Ceci est du au. fait que 
les genes sont d'abord transcrits en un ARN " primaire " qui est ensuite coupe par des 

20 enzymes d'epissage au niveau de sites nucleotidiques specifiques (sites d*epissage). Ces 
enzymes raboutent ensuite les regions codant pour la proteine, reconstituant ainsi un 
ARN " secondaire n dont les regions introniques ont ete eliminees. Par ailleurs, selon 
les phenotypes cellulaires (et done les tissus ou la differenciation) ces enzymes ne sont 
pas toutes exprimees et, ainsi, un meme ARN peut etre episse differemment dans les 

25 cellules d'un meme individu, generant ainsi des proteines avec des differences de 
sequence. Cependant, ces phenomenes peuvent aussi s'appliquer a des regions 
nucleotidiques qui sont entierement codantes (exons), mais qui, selon differents 
epissages possibles vont generer plusieurs proteines differentes a partir de la meme 
region nucleotidique, par phenomene d'epissage differentiel entre les differents produits 

30 proteiques. 

De plus, il est connu que des regions nucleotidiques peuvent avoir 
plusieurs cadres de lecture selon les trois trames potentielles du code genetique. Ainsi, 
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la presence de plusieurs codons initiateurs de traduction dans plusieurs phases de 
lecture et/ou un epissage d'ARN primaire raboutant des sequences nucleotiques 
presentes dans des phases de lectures differentes sur l'ADN, permet a une raeme region 
ADN de generer des produits proteiques sans rapports entre eux, du point de vue de la 
5 sequence peptidique. 

Enfin, le polymorph isme genetique existant entre les individus d'une meme 
espece et/ou des mutations individuelles peuvent creer ou supprimer des sites d'epissage 
dans une region ADN donnee et, ainsi, modifier la sequence et la structure du ou des 
produits proteiques normalement produits par cette region. 

10 Ainsi, la combinaison de ces differents phenomenes peut permettre qu'une 

meme sequence nucleotidique correspondant a un segment d'ADN, identifiee comme 
determinant une region genetique d'interet dans une etude donnee, comprenne 
]' information necessaire et suffisante pour definir toute une famille d'ARN episses selon 
des schemas differentiels et alternatifs, dans des cadres de lecture divers et, par la 

15 evidemment, de proteines et de polypeptides ayant des sequences " mosaiques " selon un 
cadre de lecture voire selon les trois cadres potentiels et des mutations eventuellement liees 
au polymorphisme genetique. 

Un exemple de ce phenomene peut etre represents par la region 
nucleotidique du gene env du retrovirus HIV-1. En effet, plusieurs proteines differentes 

20 sont codees par des segments de la meme sequence : par exemple, la glycoprotein 
d'enveloppe, et les proteines regulatrices TAT, REV, NEF, VEF. 

II est encore connu que des proteines peuvent resulter de I'assemblage de 
sous-unites identiques (homodimeres, homomultimeres) ou differentes (heterodimeres, 
heteromultimeres). Ainsi, les differents produits proteiques codes par une meme region 

25 ADN peuvent aussi s'assembler entre eux pour constituer des entites proteiques complexes 
multimeriques. Ce phenomene s'ajoute aux precedents et, lorsq^une proteine est identifiee 
par un fragment peptidique, on peut logiquement identifier tous les autres elements 
constitutifs de cette proteine complexe et les segments ADN et ARN episse qui les codent, 
ainsi que tous les membres de la famille de produits proteiques et leurs assemblages. 

30 Un autre exemple est fourni par la region d'ADN humain codant pour la famille de proteines MRP 14 ou 
calgranuline B, MRP8, calprotectine, psoriasine etc... 

Aussi, la presente invention a pour objet 1'utilisation d'au moins un 
polypeptide comprenant au moins un fragment d'une proteine pour obtenir une 
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composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou auto-immune, ladite proteine etant choisie parmi les proteines dont 
la sequence peptidique a l'etat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID 
N° 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID 
N° 10, SEQ ID N° 1 1, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, 
SEQ ID N° 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID 
N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, 
SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29 et les sequences peptidiques qui 
presentent au moins 70 % d'identite, de preference au moins 80 % d'identite et 
avantageusement au moins 98 % d'identite avec Tune quelconque des sequences 
peptidiques precitees, et les sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur 
de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur du 
ganglioside GM2, de la calgranuline B et de la saposine B. Dans des modes de 
realisation particuliers au moins deux polypeptides precites sont utilises en 
combinaison pour obtenir une composition diagnostique, pronostique, prophylactique 
ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un etat 
pathologique associe a une maladie degenerative et/ou auto-immune. 

L'invention concerne egalement l'utilisation d'au moins un polypeptide 
comprenant au moins un fragment d'une proteine pour obtemr une composition 
diagnostique, pronostique, prophylactique ou therapeutique destinee a detecter, 
pronostiquer, prevenir ou traiter un etat pathologique associe k une maladie 
degenerative et/ou auto-immune, ladite proteine etant choisie parmi les proteines dont 
la sequence peptidique a Fetat natif correspond a SEQ ID N° 2 , SEQ ID N° 4, SEQ ID 
N° 8, SEQ ID N° 17 et SEQ ID N° 24 et les sequences peptidiques qui presentent au 
moins 70 % d'identite, de preference au moins 80 % d'identite et avantageusement au 
moins 98 % d'identite avec 1'une quelconque des sequences peptidiques precitees. 
Avantageusement les cinq polypeptides qui repondent a la definition precedente sont 
utilises en combinaison. 
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De preference, la sequence peptidique dudit polypeptide comprend, ou 
consiste en une sequence choisie parmi Tune quelconque des SEQ ID N° 2, SEQ ID N° 
4, SEQ ID N° 8, SEQ ID N° 17 et SEQ ID N° 24. 

L'invention conceme encore 1'utilisation d'au moins un fragment d'un des 
5 polypeptiques precites pour la preparation d'un peptide immunogene, ledit peptide 
comprenant tout ou partie d'au moins une des sequences referencees SEQ ID N°s 58 a 
65 et etant utilise pour la production d'anticorps monoclonaux. 

L'invention a egalement pour objet, 1'utilisation d'au moins un fragment 
nucleotidique, pour obtenir une composition diagnostique, pronostique, prophylactique 

10 ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un etat 
pathologique associe a une maladie degenerative et/ou auto-immune, selon laquelle 
ledit fragment nucleotidique est choisi parmi des fragments qui codent pour au moins 
un fragment d'une proteine, ladite proteine etant choisie parmi les proteines dont la 
sequence peptidique a l'etat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 

15 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID N° 
10, SEQ ID N° 11, SEQ ED N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ 
ID N° 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 
21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ED N° 26, SEQ 
ID N° 27, SEQ ID N° 28 ET SEQ ID N° 29 et les sequences peptidiques qui presentent 

20 au moins 70 % d'identite, de preference au moins 80 % et avantageusement au moins 
98 % d'identite avec Tune quelconque des sequences peptidiques ci dessus, et les 
fragments complemehtaires desdits fragments, et les sequences peptidiques ou les 
fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 

25 precurseur de 1'activateur du ganglioside GM2, de la calgranuline B et de la saposine 
B. II est a la portee de l'homme du metier de determiner les sequences nucleiques des 
fragments nucleotidiques a partir des sequences peptidiques et du code genetique, ceci 
faisant partie de ses connaissances generales. 

De preference, ledit fragment nucleotidique code pour une proteine qui a 

30 l'etat natif consiste en une sequence choisie parmi Tune quelconque des SEQ ID N°s 1 
a 8 et SEQ ID N°s 10 a 29 precitees, et parmi les sequences peptidiques ou les 
fragments desdites sequences appartenant a une meme famille de proteines choisies 
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parmi le perlecan, Ie precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de l'activateur du ganglioside GM2, de la calgranuline B et de la saposine 
B. 

Un autre objet de l'invention est l'utilisation d'au moins un fragment 
5 nucleotidique pour obtenir une composition diagnostique, pronostique, prophylactique 
ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un etat 
pathologique associe a une maladie degenerative et/ou neurologique et/ou auto-immune 
selon laquelle ledit fragment est un fragment d'une sequence nucleique choisie parmi 
Tune quelconque des SEQ ID N° 30, SEQ ID N° 31, SEQ ID N° 32, SEQ ID N° 33, 

10 SEQ ID N° 34, SEQ ID N° 35, SEQ ID N° 36, SEQ ID N° 37, SEQ ID N° 38, SEQ ID 
N° 39, SEQ ID N° 40, SEQ ID N° 41, SEQ ID N° 42, SEQ ID N° 43, SEQ ID N° 44, 
SEQ ID N° 45, SEQ ID N° 46 et SEQ ID N° 47, SEQ ID N° 48, SEQ ID N° 49 et SEQ 
ID N° 50, SEQ ID N° 51, SEQ ID N° 52, SEQ ID N° 53, SEQ ID N° 54, SEQ ID N° 
55, SEQ ID N° 56, SEQ ID N° 57, SEQ ID N° 67, SEQ ID N° 66, SEQ ID N° 69, SEQ 

15 ID N° 70 et SEQ ID N° 71 et leurs sequences complementaires. 

L'invention concerne egalement Tutilisation d'un ligand specifique d'un 
polypeptide ou d*un fragment nucleotidique tel que defini ci dessus pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 

20 degenerative et/ou auto-immune. 

Par ligand, on entend toute molecule susceptible de s'associer au 
polypeptide, tel que uh anticorps monoclonal, un anticorps polyclonal, un recepteur, un 
substrat d'activite enzymatique, une enzyme dont ledit polypeptide est un cofacteur. La 
production d'anticorps polyclonaux et monoclonaux fait partie des connaissances 

25 generales de Thomme du metier. On peut citer a titre de reference Kohler G. et 
Milstein C. (1975) : Continuous culture of fosed cells secreting antibody of predefined 
specificity, Nature 256 :495-497 et Galfre G. et al. (1977) Nature, 266 : 522-550 pour 
la production d'anticorps monoclonaux et Roda A., Bolelli G.F. : Production of high- 
titer antibody to bile acids, Journal of Steroid Biochemistry, Vol. 13, pp. 449-454 

30 ( 1 980) pour la production d'anticorps polyclonaux. 

Par ligand, on entend egalement toute molecule susceptible de s'associer a 
un fragment nucleotidique, tel qu'un fragment nucleotidique partiellement ou 
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totalement complementaire, un polynucleotide complementaire, un anticorps anti- 
acides nucleiques. La production de fragments nucleotidiques ou de polynucleotides 
fait partie des connaissances generates de rhomme du metier. On peut notamment citer 
Tutilisation d'enzymes de restriction, et la synthese chimique sur synthetiseur 
5 automatique, par exemple sur des synthetiseurs commercialises par la societe Applied 
Biosystem. Par ailleurs, on connait des techniques pour la production d'anticorps anti- 
acides nucleiques. On peut citer a titre d'exemples Philippe Cros et al., Nucleic Acides 
Researc, 1994, Vol. 22, N°. 15, 2951-2957 ; Anderson, W.F. et al. (1988) Bioessays, 8 
(2), 69-74 ; Lee, J.S. et al. (1984) FEBS Lett., 168, 303-306 ; Malfoy, B. et al. (1982) 

10 Biochemistry, 21(22), 5463-5467; Stollar, B.D. et al., J. J. (eds) Methods in 
Enzymology, Academic Press, pp. 70-85 ; Traincard, F. et al. (1989) J. Immunol. 
Meth., 123, 83-91 et Traincard, F. et al. (1989) Mol. Cell. Probes, 3, 27-38). 

L'invention a encore pour objet un procede pour detecter au moins une 
proteine associee a une maladie degenerative et/ou auto-immune, dans un echantillon 

15 biologique dans lequel on met en contact l'echantillon biologique avec au moins un 
ligand specifique d'au moins un polypeptide, ledit polypeptide comprenant au moins 
un fragment d'une proteine et ladite proteine etant choisie parmi les proteines dont la 
sequence peptidique a l'etat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 
3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ED N° 7, SEQ ID N° 8, SEQ ED N° 

20 10, SEQ ID N° 1 1, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ 
ID N° 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 
21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ED N° 25, SEQ ID N° 26, SEQ 
ID N° 27, SEQ ID N° 28 et SEQ ID N° 29 et les sequences peptidiques qui presentent 
au moins 70 % dMdentite de preference au moins 80 % d'identite et avantageusement 

25 au moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 
1 a SEQ ID N° 8 et SEQ ID N° 10 a 29, et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur 
de Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B, puis on 

30 detecte la formation d'un complexe entre ledit polypeptide et ledit ligand. Ledit ligand 
est avantageusement un anticorps monoclonal, un anticorps polyclonal, un recepteur, 
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un substrat d'activite enzymatique ou une enzyme dont ledit polypeptide est un 
cofacteur. 

De meme, Pinvention concerne un procede pour detecter au moins un 
ligand associe a une maladie degenerative et/ou auto-immune, dans un echantillon 
biologique, caracterise en ce que l'on met en contact 1'echantillon biologique avec au 
moins un polypeptide comprenant au moins un fragment d'une proteine, ladite proteine 
etant choisie parmi les proteines dont la sequence peptidique a I'etat natif correspond a 
SEQ ID N° 1 , SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, 
SEQ ID N° 7, SEQ ID N° 8, SEQ ID N° 10, SEQ ID N° 1 1, SEQ ID N° 12, SEQ ID N° 
13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ ID N° 17, SEQ ID N° 18, SEQ 
ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 
24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29 et 
les sequences peptidiques qui presentent au moins 70 % d'identite, de preference au 
moins 80 % d'identite et avantageusement au moins 98 % d'identite avec Tune 
quelconque des sequences peptidiques SEQ ID N° I a SEQ ID N° 8 et SEQ ID N°s 10 
a SEQ ID N° 29, et les sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur 
de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur du 
ganglioside GM2, de la calgranuline B et de la saposine B, puis on detecte la formation 
d'un complexe entre ledit polypeptide et ledit ligand. Le ligand est toute molecule qui 
repond aux conditions precedemment decrites. 

De preference, dans les precedes decrits ci dessus la sequence du 
polypeptide comprend ou consiste en une sequence peptidique choisie parmi Tune 
quelconque des SEQ ID N° 1 a 8 et SEQ ID N° 10 a 29 precedentes et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison 
au retinol, du precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de 
la saposine B. 

L'invention concerne egalement un nouveau polypeptide qui comprend au 
moins un fragment d'une proteine dont la sequence peptidique correspond a SEQ ID 
N° 9, ledit fragment presentant au moins une mutation, en particulier au moins deux 
mutations par rapport a la sequence de reference SEQ ID N° 8. Le polypeptide est 
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avantageusement choisi parmi les polypeptides qui comprennent la sequence en acides 
amines FSWDNCFEGKDPAVIR, referencee SEQ ID N° 68 et la sequence en acides 
amines YSLPKSEFAVPDLELP, referencee SEQ ID N° 72. 

En particulier, ledit polypeptide comprend ou consiste en SEQ ID N° 9. 
5 Ce polypeptide est utilise pour obtenir une composition diagnostique, pronostique, 
prophylactique ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un 
etat pathologique associe a une maladie degenerative et/ou auto-immune, seul ou en 
melange avec au moins un polypeptide tel que defini precedemment. 

L'un des objet de l'invention est egalement un fragment nucleotidique qui 
10 code pour le fragment de la proteine dont la sequence peptidique correspond a SEQ ID 
N° 9, ledit fragment de ladite proteine presentant au moins une mutation, en particulier 
deux mutations par rapport a la sequence de reference SEQ ID N° 8. Ledit fragment 
nucleotidique, en particulier, comprend ou consiste en un fragment qui code pour SEQ 
ID N° 9. Ce fragment est utilise pour obtenir une composition diagnostique, 
15 pronostique, prophylactique ou therapeutique destinee a detecter, -prevenir ou traiter un 
etat pathologique associe a une maladie degenerative et/ou auto-immune, seul ou en 
melange avec au moins un fragment nucleotidique tel que defini precedemment. 

L'invention a aussi pour objet un procede pour detecter au moins un 
ligand associe a une maladie degenerative et/ou auto-immune, dans un echantillon 
20 biologique, selon lequel on met en contact 1'echantillon bioiogique avec au moins le 
polypeptide qui comprend ou consiste en SEQ ID N° 9 ou un melange de polypeptides 
comprenant ce polypeptide et au moins un polypeptide tel que decrit ci dessus, puis on 
detecte la formation d'un complexe ou de complexes entre le ou les polypeptides et le 
ou les ligands correspondants ; etant entendu que par ligand on entend une molecule 
25 qui repond aux conditions precitees. 

L'invention concerne egalement un procede pour detecter au moins le 
polypeptide reference SEQ ID N° 9 ou un fragment dudit polypeptide, ce fragment 
comprenant au moins une et de preference deux mutations par rapport a la sequence de 
reference SEQ ID N°8, dans un echantillon biologique selon lequel on met en contact 
30 Techantillon biologique avec au moins un ligand specifique dudit polypeptide, puis on 
detecte la formation d'un complexe entre ledit polypeptide et ledit ligand. La definition 
de ligand correspond a celle defmie precedemment. II peut s'agir entre autres d'un 
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anticorps monolonal f d'un anticorps polyclonal, d'un substrat d'activite enzymatique, 
ou d'une enzyme dont ledit polypeptide est un cofacteur, d'un recepteur. 

On peut egalement mettre en contact 1'echantillon biologique avec un 
ligand specifique du polypeptide reference SEQ ID N°9 et au moins un ligand 
specifique d'au moins un autre polypeptide tel que defini precedemment, puis on 
detecte la formation de complexes entre lesdits polypeptides et lesdits ligands 
specifiques desdits polypeptides ; etant entendu que par ligand on entend une molecule 
qui repond aux conditions decrites precedemment. 

Un autre objet de i'invention est un fragment nucleotidique codant pour 
tout ou partie du polypeptide SEQ ID N° 9, et son utilisation pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou autoimmune, eventuellement en association avec au moins un 
fragment nucleotidique tel que defini precedemment, et les fragments complementaires 
desdits fragments. 

Par fragment polypeptidique, on entend au moins tout ou partie de la 
sequence peptidique d'une proteine, en particulier un fragment polypeptique qui 
comprend environ entre 5 et 15 acides amines et plus precisement environ entre 5 et 10 
acides amines et 6 et 15 acides amines. Et par fragment nucleotidique, on entend au 
moins tout ou partie d'une sequence nucleotidique, etant entendu que par sequence 
nucleotidique, sont couvertes les sequences ADN et ARN. 

En particulier, par fragment polypeptidique ou nucleotidique, on entend 
soit des fragments associes a une meme unite moleculaire, soit des fragments dans un 
complexe moleculaire comprenant plusieurs sous-unites homologues ou heterologues 
obtenues de maniere naturelle ou artificielle, notamment par multi-epissage differentiel 
ou par synthese selective. 

L'invention conceme aussi un procede pour detecter au moins un 
polypeptide tel que defini precedemment, selon lequel on preleve un echantillon d'un 
fluide biologique d'un patient presentant un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune et eventuellement apres 
purification dudit echantillon de fluide biologique, on analyse par spectrometrie de 
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masse le profil de masse obtenu a partir du fluide biologique et on compare a un profil 
de masse de reference. 

La presente invention concerne egalement 1'utilisation dau moins un 
polypeptide de l'invention pour definir des agents efficaces therapeutiquement, et 
1'utilisation de ces agents pour prevenir et/ou traiter une maladie auto-immune et/ou 
neurologique et/ou degenerative, en particulier la sclerose en plaques. 

Ainsi, d'autres objets de l'invention sont les suivants : 

- Utilisation d'au moins un polypeptide comprenant au moins un fragment 
d'une proteine pour tester l'efficacite d'un agent therapeutique, ladite proteine etant 
choisie parmi les proteines dont la sequence peptidique a l'etat natif correspond a SEQ 
ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ 
ID N° 7, SEQ ID N° 8, SEQ ID N° 9, SEQ ID N° 10, SEQ ID N° 11, SEQ ID N° 12, 
SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ ID N° 17, SEQ ID 
N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, 
SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ 
ID N° 29, les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d'identite avec 
Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique de liaison 
au retinol, du precurseur de Factivateur du ganglioside GM2, de la calgranuline B et de 
la saposine B ; 

- Utilisation d'au moins un polypeptide comprenant au moins un fragment 
d'une proteine pour definir un materiel biologique pour la preparation d'une 
composition pharmaceutique destinee au traitement d'une maladie degenerative et/ou 
neurologique et/ou auto-immune, telle que la sclerose en plaques, ladite proteine etant 
choisie parmi les proteines dont la sequence peptidique a Tetat natif correspond a SEQ 
ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ 
ID N° 7, SEQ ID N° 8, SEQ ID N° 9, SEQ ID N° 10, SEQ ID N° 1 1, SEQ ID N° 12, 
SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ ID N° 17, SEQ ID 
N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, 
SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ED N° 28 et SEQ 
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ID N° 29, les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d'identite avec 
Pune quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisie parmi le perlacan, le precurseur de la proteine plasmatique de liaison 
au retinol, du precurseur de 1'activateur du ganglioside GM2, de la calgranuline et de la 
saposine ; 

Selon une variante avantageuse de Tune des utilisations precedentes, le 
polypeptide est choisi parmi SEQ ID N° 2, 4,8, 9, 17, 24 ; 

- Utilisation d'au moins un fragment nucleotidique, pour tester 1'efficacite 
d'un agent therapeutique pour un etat pathologique associe a une maladie degenerative 
et/ou neurologique et/ou auto-immune, selon laquelle ledit fragment nucleotidique est 
choisi parmi les fragments qui codent pour au moins un fragment d'une proteine, ladite 
proteine etant choisie parmi les proteines dont la sequence peptidique a 1'etat natif 
correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N? 5, 
SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ IDN° 9, SEQ ID N° 10, SEQ ID N° 
11, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ 
ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 
22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ED N° 26, SEQ ID N° 27, SEQ 
ID N° 28 et SEQ ID N° 29, les sequences peptidiques qui presentent au moins 70 % 
d'identite, de preference au moins 80 % et avantageusement au moins 98 % d'identite 
avec l'une quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les fragments 
complementaires desdits fragments et les fragments qui codent pour les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique de liaison 
au retinol, du precurseur de 1'activateur du ganglioside GM2, de la calgranuline B et de 
la saposine B. 

- Utilisation pour tester l'efficacite d'un agent therapeutique pour un etat 
pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune, de proteines recombinantes et/ou codees par tout ou partie des fragments 
nucleotidiques definis au paragraphe precedent ; 



WO 01/05422 



18 



PCT/FROO/02057 



-Utilisation d'au moins un fragment nucleotidique 
pour la preparation d'une composition pharmaceutique destinee au traitement 
d'une maladie degenerative et/ou neurologique et/ou auto-immune, telle que la sclerose 
en plaques, selon laquelle ledit fragment nucleotidique est choisi parmi des fragments 
qui codent pour au moins un fragment d'une proteine, ladite proteine etant choisie 
parmi les proteines dont la sequence peptidique a l'etat natif correspond a SEQ ID N° 
1, SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 
7, SEQ ID N° 8, SEQ IDN° 9, SEQ ID N° 10, SEQ ID N° 11, SEQ ID N° 12, SEQ ID 
N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ ID N° 17, SEQ ID N° 18, 
SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID 
N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29, 
les sequences peptidiques qui presentent au moins 70 % d'identite, de preference au 
moins 80 % et avantageusement au moins 98 % d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 1 a 29, et les fragments complementaires desdits 
fragments et les fragments qui codent pour les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisie parmi Ie 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur 
de ractivateur du ganglioside GM2, de la calgranuline B et de la saposine B ; 

-Utilisation pour la preparation d'une composition pharmaceutique 
destinee au traitement d'une maladie degenerative et/ou neurologique et/ou auto- 
immune, telle que la sclerose en plaques, de proteines recombinantes et/ou codees par 
tout ou partie des fragments nucleotidiques defmis au paragraphe precedent. 

Avantageusement, ledit fragment nucleotidique utilise code pour ladite 

proteine. 

De preference, la sequence peptidique de ladite proteine a Tetat natif 
consiste en une sequence choisie parmi l'une quelconque des SEQ ID N° 1 a 29, les 
sequences peptidiques qui presentent au moins 70 % d'identite de preference au moins 
80 % d'identite et avantageusement au moins 98 d'identite avec l'une quelconque des 
sequences peptidiques SEQ ID N° 1 a 29, et les sequences peptidiques ou les 
fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
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precurseur de Pactivateur du ganglioside GM2, de la calgranuline B et de la saposine 
B. Les polypeptides sont preferentiellement choisis parmi SEQ ID N° 2, 4, 8, 9, 17, 24. 

- Utilisation d'au moins un fragment nucleotidique, pour tester Pefficacite 
d'un agent therapeutique pour un etat pathologique associe a une maladie degenerative 
5 et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un fragment 
d'une sequence nucleique choisie parmi Tune quelconque des SEQ ID N° 30, SEQ ID 
N° 3 1, SEQ ID N° 32, SEQ ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID N° 36, 
SEQ ID N° 37, SEQ ID N° 38, SEQ ID N° 39, SEQ ID N° 40, SEQ ID N° 41, SEQ ID 
N° 42, SEQ ID N° 43, SEQ ID N° 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ ID N° 47, 
10 SEQ ID N° 48, SEQ ED N° 49 et SEQ ID N° 50, SEQ ID N° 51, SEQ ID N° 52, SEQ 
ID N° 53, SEQ ID N° 54, SEQ ID N° 55, SEQ ID N° 56, SEQ ID N° 57, SEQ ID N° 
66, SEQ ID N° 67, SEQ ID N° 69, SEQ ID N°70 , SEQ ID N° 71, et leurs sequences 
complementaires. 

-Utilisation d'au moins un fragment nucleotidique 
15. pour la preparation d'une composition pharmaceutique destinee au traitement 
d'une maladie degenerative et/ou neurologique et/ou auto-immune, telle que la sclerose 
en plaques selon laquelle ledit fragment est un fragment d'une sequence nucleique 
choisie parmi Tune quelconque des SEQ ID N° 30, SEQ ID N° 31, SEQ ED N° 32, 
SEQ ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID N° 36, SEQ ID N° 37, SEQ ID 
20 N° 38, SEQ ID N° 39, SEQ ID N° 40, SEQ ID N° 4 1 , SEQ ID N° 42, SEQ ED N° 43, 
SEQ ID N° 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ ID N° 47, SEQ ID N° 48, SEQ 
ID N° 49 et SEQ ID N° 50, SEQ ID N° 51, SEQ ID N° 52, SEQ ID N° 53, SEQ ID N° 
54, SEQ ID N° 55, SEQ ID N° 56, SEQ ID N° 57, SEQ ID N° 66, SEQ ID N°67, SEQ 
ID N° 68, SEQ ID N° 69, SEQ ID N°70 , SEQ ID N° 71, et leurs sequences 
25 complementaires. 

La sequence nucleique est de preference choisie parmi SEQ ID N° 30, 31, 

42, 53. 

- Utilisation de la lycorine pour la preparation d'une composition pour la 
prevention et/ou le traitement de maladie degenerative et/ou neurologique et/ou auto- 
30 immune. 

Par efficacite therapeutique, on entend le benefice clinique et biologique 
acquis apres administration d'un agent therapeutique en vue d'une amelioration, voire 
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d'une guerison de la maladie. Ce benefice se traduit entre autre par une diminution des 
signes cliniques, biologiques, et des effets pathologiques de la maladie apres une 
analyse clinique par le medecin et/ou des analyses biologiques, telles que imagerie par 
resonance magnetique, analyse des bandes oligoclonales dans le liquide cephalo- 
rachidien, analyse de potentiels evoques et le test de detection de gliotoxicite appele 
bio-essai, dont le principe est decrit dans la demande de brevet WO 98/11439 
precedemment citee. Cette diminution des signes cliniques et effets pathologiques doit 
entrainer un benefice pour le patient (Schwartz et Lazar, 1995, Elements de statistique 
medicale et biologique, eds Flammarion ; Lazar et Schwartz, 1995, Elements de 
statistique medicale et biologique, eds Flammarion ). La maladie etudiee de preference 
est la sclerose en plaques. 

On entend par composition a usage prophylactique et/ou therapeutique* 
toute composition qui comprend un agent therapeutiquement efficace. Ces agents 
therapeutiques sont capables (i) d'influencer de maniere qualitative et/ou quantitative 
r activite biologique et/ou la fonction des proteines d'interet identifiees dans la presente 
invention, de preference Pactivite gliotoxique et/ou (ii) de moduler et/ou d'inhiber 
I 'expression de ces proteines et/ou (iii) de diminuer la concentration de ces proteines 
dans un compartiment extracellulaire et/ou intracellular, et/ou de substituer une forme 
non pathogene a une foime pathogene, par exemple mutee, d'une de ces proteines et/ou 
de moduler leur fixation a au moins un de leur ligand ; ledit ligand etant une molecule 
qui repond aux criteres precedemment decrits. Differents agents therapeutiques sont 
produits en suivant les approches classiques largement decrites dans la litterature. Les 
differents groupes d'agents therapeutiques definis a partir des proteines d'interet 
identifiees dans cette presente invention sont decrits ci-dessous. Leur activite ou 
efficacite prophylactique et/ou therapeutique est evaluee in vitro et/ou in vivo. 

Evaluation de Fefficacite d'un agent therapeutique in vitro : des 
echantillons d'urine d'individus sains et de patients atteints de la sclerose en plaque, de 
preference en phase active, sont testes pour leur activite gliotoxique in vitro en suivant 
le protocole du bio-essai decrit dans la demande de brevet WO 98/11439, 
precedemment citee. L'experience est realisee en parallele en ajoutant ou non dans les 
echantillons d'urine testes l'agent therapeutique dont l'efficacite est a tester. Des essais 
sont realises a differentes concentrations de cet agent, et apres differents temps 
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d'incubation avec l'echantillon, a une temperature cT environ 37°C ou a temperature 
ambiante, pour chaque concentration d'agent teste, avant la realisation du test bio-essai. 
L'activite gliotoxique est determinee pour chaque echantillon brut ou purifie d'urine 
temoin et de patient en presence ou en absence de l'agent therapeutique teste. Un agent 
prophylactique et/ou therapeutique pour la sclerose en plaques est un agent qui permet 
une diminution ou une inhibition de l'activite gliotoxique dans un fluide biologique des 
patients, en particulier dans 1'urine. Cette diminution ou inhibition est evaluee par 
rapport a l'activite gliotoxique detectee dans le fluide biologique des patients SEP en 
absence de l'agent teste qui fixe la borne superieure et par rapport a l'activite 
gliotoxique detectee dans 1 'urine d'individu sain qui determine la borne inferieure 
(Schwartz et Lazar, 1995, Elements de statistique medicale et biologique, eds 
Flammarion ; Lazar et Schwartz, 1995, Elements de statistique medicale et biologique, 
eds Flammarion). L'efficacite therapeutique de plusieurs agents peuvent etre evaluee 
en combinaison dans un meme essai. 

Evaluation de l'efficacite d'un agent therapeutique utilisant un modele 
animal : a un animal sont injectees des fractions d'urine purifiee et/ou au moins un 
polypeptide de T invention et/ou au moins une proteine obtenue par recombinaison 
genetique qui correspond a au moins un polypeptide de 1'invention et/ou au moins un 
polypeptide de synthese dont la sequence en acides amines correspond a la sequence 
d'au moins un polypeptide de 1'invention. Les injections sont effectuees, a differentes 
concentrations etablies, a des animaux mammiferes, tels que souris ou rat, de 
preference un rat Lewis selon le protocole decrit dans la demande de brevet 
W097/33466 citee precedemment. A des series d'animaux sont injectees, par voie 
intradermique, intraveineuse, intrathecals intracerebrale, intramusculaire, ou autres, 
differentes concentrations d'une fraction d'urine brute ou purifiee ou d'au moins un 
polypeptide et/ou une proteine, tels que definis ci-dessus. Un controle negatif est 
effectue en parallels L'agent prophylactique et/ou therapeutique a evaluer et ensuite 
injecte a differentes concentrations et par differentes voies d'administration a un 
animal mammifere, de preference a une souris ou a un rat. Les injections sont realisees 
en une seule dose ou en doses repetees, avec differents temps d'intervalle entre chaque 
administration. Quelques heures a quelques semaines apres 1' administration, des 
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echantillons biologiques, de preference du sang, du serum, du Iiquide cephalo- 
rachidien, de Purine sont preleves. Sur ces echantillons sont realises : 

(i) une mesure de 1'activite gliotoxique par le bio-essai, et/ou 

(ii) une mesure d'activite des polypeptides et/ou proteines d'interet de l'invention, 
seuls ou en combinaison comme decrit au moins dans : Li et ah, 1983, Am J Hum 
Genet 35 :629-634 ; Li et aL, 1988 J Biol Chem 263 : 6588-6591 ; Li et ah, 1981 J Biol 
Chem 256 : 6234-6240 ;Li et aL, 1976 J Biol Chem 251 :1 159 ; Kase et al., 1996, 
FebsLetters 393 : 74-76 ; Kishimoto et aL, 1992, J Lipid Res 33 : 1255-1267 ; O'Brien 
et aL, 1991 Faseb J 5 : 301-308 ; Murthy et al.,1993 J Immunol 151 : 6291-6301 ; 
Murao et aL, 1990 Cell growth Differ 1 : 447-454, et/ou 

(iii) un dosage des polypeptides et/ou proteines d'interet, seuls ou en combinaison, par 
ELISA (Enzyme Linked-Immunosorbant Assay) et/ou Western Blot, en utilisant des 
anticorps ou des fragments d'anticorps capables de se fixer a au moins un des 
polypeptides et/ou proteines de l'invention, ou leur fragment, et/ou 

iv) un dosage d'anticorps specifiques des polypeptides et/ou proteines d'interet ou leurs 
fragments, seuls ou en combinaison ou le dosage d'au moins un ligand capable de se 
fixer aux polypeptides et/ou proteines d'interet ou leurs fragments, et/ou 
(v) un dosage de la reponse immune cellulaire « helper » et/ou cytotoxique induite 
contre les polypeptides et proteines d'interet ou leurs fragments et tout peptide 
immunogene derivant de ces polypeptides, proteines et fragments, en realisant, par 
exemple, un test d'activation in vitro de cellules lymphocytes T " helper " specifiques 
de l'antigene administre; en quantifiant les lymphocytes T cytotoxiques selon la 
technique dite ELISPOT decrite par Scheibenbogen et al.,1997 Clinical Cancer 
Research 3 : 221-226. Une telle determination est particulierement avantageuse lorsque 
Ton veut evaluer 1'efficacite d'une approche vaccinale pour la mise en ceuvre chez un 
patient donne ou pour diagnostiquer et/ou pronostiquer un etat pathologique potentiel 
en cherchant a mettre en evidence une reponse immune naturellement developpee par 
le patient contre l'antigene, les polypeptides, les proteines d'interet ou les fragments 
immunogenes derives de ces proteines. 

Par « ligand capable de se fixer a une proteine », on entend toute molecule 
capable de reconnaitre la proteine ou une partie de la proteine. Cela peut etre verifie par 
exemple in vitro par tests Elisa et/ou Western blot . 
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On designe par « polypeptides et/ou proteines d'interet de l'invention» le 
fragment C-terminal du perlecan (SEQ ID N°2), le precurseur de la proteine 
plasmatique de liaison au retinoi (SEQ ID N°4), la proteine activateur du GM2 (SEQ 
ID N° 8), la proteine mutee de P activateur du GM2 (SEQ ID N° 9), la calgranuline B 
5 (SEQ ID N° 1 7), la saposine B (SEQ ID N° 24), les proteines ou fragments appartenant 
a la famille du precurseur de la proteine plasmatique de liaison au retinoi (par exemple 
SEQ ID N° 5 a 7), les proteines ou fragments appartenant a la famille de la proteine 
activateur du GM2 (par exemple SEQ ID N° 10 a 16), les proteines ou fragments 
appartenant a la famille de la proteine calgranuline B (par exemple SEQ ID N° 18 a 

10 23), les proteines ou fragments appartenant a la famille de la proteine saposine B (par 
exemple SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 
% d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
% d'identite avec Pune quelconque des sequences peptidiques SEQ ID N° 1 a 29. 

L'animal est ensuite sacrifie et des coupes histologiques de differents 

15 tissus sont realisees, de preference des coupes de cerveaux. Differentes etudes et 
observations sont realisees pour detecter et/ou quantifier les effets caracteristiques des 
polypeptides et/ou proteines actives associees a la fraction gliotoxique , c'est a dire une 
apoptose des cellules gliales, et/ou Pouverture de la barriere hemato-encephalique, 
et/ou une demyelinisation. La presence ou Pexpression des polypeptides et/ou proteines 

20 d'interet identifies est egalement observee et/ou quantifiee dans ces tissus : 

(i) par des analyses d'immunohistologie classiques en utilisant des ligands des 
polypeptides et/ou proteines d'interet et/ou leurs fragments et/ou des anticorps 
monoclonaux ou polyclonaux ou des fragments desdits qui se lient aux polypeptides 
et/ou proteines d'interet, ou a leurs fragments, et/ou 

25 (ii) par des techniques d'hybridation in situ classiques en utilisant des fragments 
d'acides nucleiques ou des oligonucleotides definis a partir des sequences 
polypeptidiques et/ou proteiques d'interet ; et/ou 

(iii) par des techniques d'amplification par PCR et/ou RT-PCR in situ en utilisant des 
fragments d'acides nucleiques ou des amorces definis a partir des sequences 
30 polypeptidiques et/ou proteiques d'interet. 

Par anticorps capable de se fixer a un polypeptide, a une proteine ou a 
leurs fragments, on entend tout anticorps monoclonal ou polyclonal et tout fragment 
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desdits anticorps capable de reconnaitre le polypeptide, la proteine ou leurs fragments. 
La capacite des anticorps a reconnaitre lesdits polypeptides, proteines ou leurs 
fragments est verifiee in vitro, par exemple en ELISA et/ou Western Blot. Un 
anticorps capable de se fixer a la proteine saposine B (SEQ ID N° 24) ou a tout 
5 fragment de cette proteine est decrit par Misasi et al. 1998, J. NeuroChem. 71 : 2313 et 
Klein et al. 1994, BBRC 200 : 1440-1448 ou peut etre produit en utilisant les methodes 
conventionnelles, par exemple celles referencees precedemment pour la production 
d'anticorps monoclonaux et polyclonaux, par immunisation a partir de la proteine 
naturelle, d'une proteine recombinante, d'un polypeptide de synthese ou de leurs 
10 fragments. Les peptides immunogenes pour la production d'anticorps monoclonaux 
anti-saposine B sont les peptides correspondant aux sequences SEQ ID N° 61 et SEQ 
ID N° 62. 

Par exemple, un anticorps capable de se fixer a la proteine activatrice du 
GM2 (SEQ ID N° 8) ou a tout fragment de cette proteine est illustre par Yuziuk et aL, 

15 1998 J Biol Chem 273 : 66-72 ou peut etre produit en utilisant les .methodes 
conventionnelles connues de l'homme de Tart. Cet anticorps peut etre par exemple 
produit apres injection a des souris ou lapin de la proteine naturelle ou tout fragment, 
et/ou de la proteine recombinante ou tout fragment, et/ou de peptides definis et 
synthetises a partir de la sequence proteique de la proteine. Les peptides immunogenes 

20 utilises pour la production d'anticorps monoclonaux anti-GM2 sont les peptides 
references SEQ ID N° 58, SEQ ID N° 59 et SEQ ED N° 60. Un anticorps capable de se 
fixer a la proteine Galgranuline B (SEQ ID N° 17) ou a tout fragment de cette proteine 
est decrit par Saintigny et al. y 1992 J Invest Dermatol 99 : 639-644 et Goebeler et al 
1994 J Leukoc Biol 55 : 259-261, ou peut etre produit en utilisant les methodes 

25 conventionnelles. Les peptides immunogenes pour la production d'anticorps 
monoclonaux anti-calgranuline B sont les peptides correspondant aux sequences SEQ 
ID N° 63, SEQ ID N° 64 et SEQ ID N° 65. Un anticorps capable de se fixer a la 
proteine mutee activatrice du GM2 (SEQ ID N°9) ou a tout fragment de cette proteine 
peut etre produit en utilisant les methodes conventionnelles definies ci dessus. 

30 Par proteine naturelle et fragment, on entend toute proteine isolee, purifiee 

totalement ou partiellement obtenue a partir d'echantillon humain ou animal et tout 
fragment obtenu a partir de cette proteine. Par exemple, on obtient la proteine naturelle 
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correspondant a la saposine B (SEQ ID N° 24) en suivant la technique decrite par 
Waring et al. 1998 Mol Genet Metab 63 : 14-25 ; la proteine naturelle correspondant a 
la proteine activatrice du GM2 (SEQ ID N° 8) en suivant la technique decrite par 
DeGasperi et al.,1989 Biochem J 260: 777-783, Vogel et al., 1987 Arch Biochem 
5 Biophys 259: 627-638, Mitsuyama, 1983 Hokkaido Igaku Zasshi 58: 502-512; 
Hirabayashi et al 1983 J Neurochem 40: 168-175, Conzelmann et al, 1979 Hoppe 
Seylers Z Physiol Chem 360 : 1837-1849, Li et al., 1976 J Biol Chem 251 : 1 159-1 163. 
La proteine naturelle correspondant a la calgranuline B (SEQ ID N° 17) est obtenue en 
suivant la technique decrite par Hitomi et al. 1996 J Cell Sci 109 : 805-815, Van den 
10 Bos et ah 1998 Protein Expr Purif 13 : 313-318 et Raftery et al. 1996 Biochem J 316 : 
285-293. 

Par proteine recombinante ou fragment d'une proteine recombinante, on 
fait reference a toute proteine ou fragment de proteine produit dans une cellule 
procaryote ou eucaryote a partir d'une sequence nucleotidique codant pour la proteine 

15 ou son fragment et transfectee dans la cellule, cette proteine ou son fragment etant 
ensuite purifiee. D'une maniere generate, toute cellule issue d'un organisme procaryote 
ou eucaryote peut etre utilisee dans le cadre de la presente invention, mais les cellules 
issues d'organismes eucaryotes sont preferees. On peut citer a titre d'exemple les 
cellules CHO, les cellules COS, les cellules Semliki. Aux fins de la presente invention, 

20 ladite cellule peut etre sauvage ou mutante. Par exemple, la proteine recombinante 
correspondant a la saposine B (SEQ ID N° 24) peut etre obtenue en suivant les 
techniques decrites par Zaltash et al.1998 Bebbs letter 423 : 1-4 et Qi et al. 1994 J Biol 
Chem 269: 16746-16753. Une telle proteine recombinante est au moins disponible 
aupres de Kase et al. 1996 Febs Lett 393: 74-76. La proteine recombinante 

25 correspondant a la proteine activatrice du GM2 (SEQ ID N° 8) peut etre produite par 
les techniques decrites par Yuziuk et al. 1998 J Biol Chem 273 : 66-72 et Bierfreund et 
aL, 1999 Neurochem Res 24 : 295-300. La proteine recombinante correspondant a la 
calgranuline B (SEQ ID N° 17) peut etre obtenue selon le protocole de Longbottom et 
aU992 Biochim Biophys Acta 1 120 :215-222, Raftery et al. 1999 Protein Expr Purif 

30 15 :228-235. Une telle proteine recombinante est disponible au moins aupres de 
Klempt et al. 1997 Febs Letter 408 : 81-84. 
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Par sequence nucleotidique d'ADN ou fragment nucleotidique d'ADN 
codant pour tout ou partie de la proteine saposine B (SEQ ID N°24), on entend la 
sequence d'acides nucleiques SEQ ID N° 53 ou un fragment de cette sequence. Par 
sequence ou fragment nucleotidique ARN codant pour tout ou partie de la proteine 
5 saposine B (SEQ ID N° 24), on entend toute sequence deduite de la sequence d'ADN 
SEQ ID N° 53, en tenant compte du code genetique et des phenomenes d'epissage. 

Par sequence nucleotidique d'ADN ou fragment nucleotidique d'ADN 
codant pour tout ou partie de la proteine activatrice du GM2 (SEQ ID N° 8), on entend 
la sequence d'acides nucleiques SEQ ID N° 31 ou un fragment de cette sequence. Par 
10 sequence ou fragment nucleotidique d'ARN codant pour tout ou partie de la proteine 
activatrice du GM2 (SEQ ID N° 8), on entend toute sequence deduite de la sequence 
ADN SEQ ID N° 31, en tenant compte du code genetique et des phenomenes 
d'epissage. 

Par sequence nucleotidique d'ADN ou fragment nucleotidique d'ADN 

15 codant pour tout ou partie de la proteine calgranuline B (SEQ ID N° 17), on entend la 
sequence d'acides nucleiques SEQ ID N° 42 ou un fragment de cette sequence. Par 
sequence ou fragment nucleotidique d'ARN codant pour tout ou partie de la proteine 
calgranuline B (SEQ ID N° 17), on entend toute sequence deduite de la sequence ADN 
SEQ ID N° 42, en tenant compte du code genetique et des phenomenes d'epissage. 

20 Par sequence ou fragment nucleotidique codant pour tout ou partie de la 

proteine mutee (SEQ ID N° 9), on entend la sequence d'acides nucleiques deduite de la 
sequence SEQ ID N° 9, en tenant compte du code genetique. Par sequence ou fragment 
nucleotidique ARN codant pour tout ou partie de cette proteine mutee B (SEQ ID N° 
9), on entend toute sequence deduite de la sequence ADN, en tenant compte du code 

25 genetique et des phenomenes d'epissage. 

Par activite proteique, on entend une fonction caracteristique biologique 
de la proteine. Cette activite proteique peut etre mise en evidence par des techniques 
connues de Phomme de Tart. Par exemple, l'activite de la saposine B (SEQ ID N° 24) 
et des proteines de la famille de la saposine B (par exemple SEQ ID N° 25 a 29), peut 

30 etre detectee par la mise en ceuvre des protocoles decrits par Li et al., 1983, Am J Hum 
Genet 35 :629-634,; Li et ah, 1988 J Biol Chem 263 : 6588-6591, Li et al., 1981 J Biol 
Chem 256 : 6234-6240 et Li et al., 1976 J Biol Chem 251 :1 159. Par activite de la 
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proteine activatrice du GM2 (SEQ ID N° 8) et des proteines de la meme famille (par 
exemple SEQ ID N° 10 a 16), on entend au moins l'activite detectee par la mise en 
ceuvre des protocoles decrits par exemple par Kase et al., 1996, Febs Letters 393 : 74- 
76, Kishimoto et al, 1992, J Lipid Res 33 : 1255-1267 et O'Brien et al., 1991 Faseb J 
5 5 : 301-308. Par activite de la calgranuline B (SEQ ID N° 17) et les proteines de la 
meme famille de la calgranuline b (par exemple SEQ ID N° 18a 23) et toute, on entend 
au moins l'activite detectee par la mise en ceuvre des protocoles decrits par exemple 
par Murthy et al.,1993 J Immunol 151 : 6291-6301 et Murao et al, 1990 Cell growth 
Differ i : 447-454. 

10 L'obtention d'un modele animal transgenique, de preference murin, pour 

une pathologie humaine est techniquement realisable. Brievement, 1'animal 
transgenique est produit en utilisant les techniques conventionnelles decrites et possede 
integre dans son genome les acides nucleiques codant pour les proteines ou leurs 
fragments. 

15 Evaluation de l'efficacite d'un agent therapeutique et suivi therapeutique 

ex vivo, chez Phomme : 

les agents therapeutiques a tester pour une activite therapeutique et/ou 
pour un suivi therapeutique sont administres par differentes voies a 1'homme, telles que 
les voies intradermique, intraveineuse, intramusculaire, intracerebrale, orale, ou autres. 

20 Differentes doses sont administrees a l'etre humain. Le dossier clinique du patient au 
moment de la premiere administration est parfaitement connu. Une ou plusieurs 
administrations peuvent etre realisees avec des temps d'intervalle differents entre 
chaque administration pouvant aller de quelques jours a quelques annees. Des 
echantillons biologiques sont preleves a des intervalles de temps determines apres 

25 administration de 1' agent therapeutique, de preference du sang, du serum, du liquide 
cephalo-rachidien et de Purine. Differentes analyses sont realisees a partir de ces 
echantillons. Juste avant la premiere administration de Tagent therapeutique, ces 
prelevements et ces memes analyses sont egalement realises. Un examen clinique et 
biologique classique (IRM, bandes oligoclonales dans le liquide cephalo-rachidien, 

30 potentiels evoques) est realise egalement en parallele des analyses supplementaires qui 
sont etre decrites ci dessous, a differentes temps de l'analyse. Les analyses realisees 
sont : 
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(i) une mesure de Lactivite gliotoxique par le bio-essai a partir d'echantillons de serum, de LCR et 
d'urine, et/ou 

(ii) une mesure d'activite des proteines d'interet identifiees dans la presente invention seules ou en 
combinaison comme decrit par exemple par : Li et aL, 1983, Am J Hum Genet 35 :629-634 ; Li et aL, 

5 1988 J Biol Chem 263 : 6588-6591 ; Li et aL, 1981 J Biol Chem 256 : 6234-6240 ;Li et ai., 1976 J Biol 
Chem 251 :1 159 ; Kase et aL, 1996, FebsLetters 393 : 74-76 ; Kishimoto et aL, 1992, J Lipid Res 33 : 
1255-1267 ; O'Brien et aL, 1991 Faseb J 5 : 301-308 ; Murthy et al.,1993 J Immunol 151 : 6291-6301 ; 
Murao et aL, 1990 Cell growth Differ 1 : 447-454, et/ou 

(iii) un dosage des proteines d'interet ou de leurs fragments, seuls ou en 
10 combinaison, dans les echantillons de sang/serum, LCR, urine par ELISA et/ou 

Western Blot, en utilisant des anticorps ou des fragments d'anticorps capables de se 
fixer a au moins une des proteines ou a un de leur fragment, et/ou 

(iv) un dosage d'anticorps specifiques des proteines d'interet ou de leurs 
fragments dans des echantillons de sang/serum, LCR, urine, par ELISA et/ou Western 

15 blot en utilisant une proteine naturelle ou un fragment de la proteine naturelle et/ou une 
proteine recombinante ou un fragment de cette proteine recombinante, seuls ou en 
combinaison. De meme un dosage de ligands capables de se fixer aux proteines 
d'interet identifiees, seules ou en combinaison, peut etre realise, et/ou 

(v) un dosage de la reponse immune cellulaire « helper » et/ou cytotoxique induite 
20 contre les proteines d'interet et tout peptide immunogene derivant de ces proteines, par 

exemple en reaiisant un test d' activation in vitro de cellules lymphocytes T specifiques 
de l'antigene administre (exemple). Par exemple en reaiisant un test d'activation in 
vitro de cellules lymphocytes T helper specifiques de l'antigene administre (exemple) ; 
Par exemple en quantifiant les lymphocytes T cytotoxiques selon la technique dite 

25 ELISPOT decrite par Scheibenbogen et al.,1997 Clinical Cancer Research 3 : 221-226. 
Une telle determination est particulierement avantageuse lorsque Ton souhaite evaluer 
1'efficacite d'une approche vaccinale mise en ceuvre chez un patient donne ou pour 
diagnostiquer un etat pathologique potentiel chez un patient en cherchant a mettre en 
evidence une reponse immune naturellement developpee par ledit patient contre 

30 Tantigene les proteines d'interet ou tout fragment immunogene derives de ces 
proteines, seuls ou en combinaison, et/ou 

(vi) une detection de fragments d'ADN et/ou d'ARN codant pour les proteines ou un 
fragment des proteines d'interet par hybridation nucleotidique selon les techniques bien 
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connues de l'homme de Part (Southern blot, Northern blot, ELOSA 44 Enzyme-Linked 
Oligosorbent Assay " (Katz JB et al., Am. J. Vet. Res., 1993 Dec ; 54 (12) :2021-6 et 
Francois Mallet et al., Journal of Clinical Microbiology, June 1993, pl444-1449)) et/ou 
par methode d'amplification de I'ADN et/ou TARN , par exemple par PCR, RT-PCR, 
5 en utilisant des fragments d'acides nucleiques codant pour la sequence des proteines 
d'interet, et/ou 

(vii) par biopsie de tissus, de preference du cerveau, et l'observation des effets 
caracteristiques des proteines actives associees a la fraction gliotoxique, c'est a dire 
une apoptose des cellules gliales et/ou 1'ouverture de la barriere hemato-encephalique 

10 et/ou l'observation de phenomenes de demyelinisation, et/ou 

(viii) par biopsie de tissus ou sur cellules circulantes (sang, LCR), Pobservation de la 
presence des proteines d'interet et l'estimation de leur expression par observation 
immunohistologique sur des coupes histologiques realisees a partir des tissus, en 
utilisant des ligands et/ou des anticorps ou leurs fragments capables de se fixer aux 

15 proteines d'interet, et/ou 

(ix) par biopsie de tissus ou sur cellules circulantes (sang, LCR), 
l'observation de l'expression des proteines d'interet par hybridation in situ des 
molecules d'ARN codant pour les proteines d'interet en utilisant des acides nucleiques 
definis a partir des sequences des proteines d'interet, et/ou 

20 (x) par biopsie de tissus ou sur cellules circulantes (sang, LCR), la 

determination de Pexpression des proteines d'interet par amplification de ces ARN par 
des techniques classiques, comme par exemple, la RT-PCR, en utilisant des acides 
nucleiques definis a partir des sequences des proteines d'interet. 

On designe par « polypeptides et/ou proteines d'interet de l'invention » le 

25 fragment C-terminal du perlecan (SEQ ID N°2), le precurseur de la proteine 
plasmatique de liaison au retinol (SEQ ID N°4), la proteine activateur du GM2 (SEQ 
ID N° 8), la proteine mutee de l'activateur du GM2 (SEQ ID N° 9), la calgranuline B 
(SEQ ID N° 17), la saposine B (SEQ ID N° 24), les proteines ou fragments appartenant 
a la famille du precurseur de la proteine plasmatique de liaison au retinol (par exemple 

30 SEQ ID N° 5 a 7), les proteines ou fragments appartenant a la famille de la proteine 
activateur du GM2 (par exemple SEQ ID N° 10 a 16), les proteines ou fragments 
appartenant a la famille de la proteine calgranuline B (par exemple SEQ ID N° 18 a 
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23), les proteines ou fragments appartenant a la famille de la proteine saposine B (par 
exemple SEQ ID N° 25 a 29), et les sequences peptidiques qui presentent au moins 70 
% d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29. 
5 On designe par sequence d'acides nucleiques ADN ou fragments codant 

pour les 'polypeptides et/ou proteines d'interet de I'invention' la sequence d'acides 
nucleiques codant pour le fragment C-terminal du perlecan (SEQ ID N°2), la sequence 
d'acides nucleiques codant pour le precurseur de la proteine plasmatique de liaison au 
retinol (SEQ ID N°4), la sequence d'acides nucleiques (SEQ ID N° 31) codant pour la 

10 proteine activateur du GM2 (SEQ ID N° 8), la sequence d'acides nucleiques codant 
pour la proteine mutee de l'activateur du GM2 (SEQ ID N° 9), la sequence d'acides 
nucleique (SEQ ID N° 42) codant pour la calgranuline B (SEQ ID N° 17), la sequence 
d'acides nucleiques (SEQ ID N°53) codant pour la saposine B (SEQ ID N° 24), les 
sequences d'acides nucleiques ADN et/ou ARN (SEQ ID N° 30 a 57) codant pour les 

15 proteines ou fragments appartenant a la famille du precurseur de la proteine 
plasmatique de liaison au retinol (par exemple SEQ ID N° 5 a 7), les proteines ou 
fragments appartenant a la famille de la proteine activateur du GM2 (par exemple SEQ 
ID N° 10 a 16), les proteines ou fragments appartenant a la famille de la proteine 
calgranuline B (par exemple SEQ ID N° 18 a 23), les proteines ou fragments 

20 appartenant a la famille de la proteine saposine B (par exemple SEQ ID N° 25 a 29). 

Une proteine ou un variant d'une proteine choisie plus particulierement 
parmi les sequences definies dans les identificateurs SEQ ID N°s 2, 4, 8 , 9, 17 et 24 ou 
leurs fragments, ou parmi les sequences correspondant aux proteines des families de 
ces dites sequences (par exemple SEQ ID N° 1, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ 

25 ID N° 10 a 16, SEQ ID N° 18 a 24, SEQ ID N° 25 a 29), et les sequences peptidiques 
qui presentent au moins 70 % d'identite de preference au moins 80 % d'identite et 
avantageusement au moins 98 d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° 1 a 29, independamment ou en combinaison, presente un effet 
toxique directement ou indirectement, vis a vis de cellules, en particulier vis a vis des 

30 cellules gliales, qui est mis en evidence par le bio-essai precite. Les auto-anticoips 
produits en reponse a la presence de cette proteine ou de ces proteines sont associes au 
processus auto-immun. Ainsi, la cible du ou des agent(s) therapeutique(s) est par 
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exemple (i) la proteine naturelle ou les proteines naturelles ou leurs variants dans le but 
de reguier leur expression et/ou leur concentration intracellulaire et/ou leur 
concentration dans la circulation, (ii) un anticorps specifique d'au moins une telle 
proteine. L'agent therapeutique ou les agents therapeutiques definis eliminent la cible 
directement, par induction d'une reponse immune specifique et/ou la neutralisent. 

La presente invention concerne done un materiel biologique pour la 
preparation d'une composition pharmaceutique destinee au traitement de mammiferes 
atteints de pathologies degenerative et/ou auto-immune et/ou neurologique, de 
preference la sclerose en plaques, ladite composition comprenant : 

(i) soit au moins une proteine naturelle et/ou une proteine recombinante ou 
leurs fragments dont la sequence correspond a tout ou partie des sequences referencees 
SEQ ID N° 2, 4, 8, 9, 17 et 24 et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisie parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
l'activateur du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple 
SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, 
SEQ ID N° 25 a 29), et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° la 29, 
independamment ou en combinaison, 

(ii) soit au moins un ligand specifique d'au moins une desdites proteines 
ou leurs fragments dont la sequence correspond a tout ou partie des sequences 
referencees SEQ ID N° 2, 4, 8, 9, 17 et 24, et les sequences peptidiques ou les 
fragments desdites sequences appartenant a une meme famille de proteines choisie 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de l'activateur du ganglioside GM2, de la calgranuline B et de la saposine B 
(par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ 
ID N° 18 a 23, SEQ ID N° 25 a 29), et les sequences peptidiques qui presentent au 
moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 
moins 98 d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 
29, independamment ou en combinaison, 
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(iii) soit au moins un anticorps polyclonal ou monoclonal specifique d'au 
moins une desdites proteines ou leurs fragments dont la sequence correspond a tout ou 
partie des sequences referencees SEQ ID N° 2, 4, 8, 9, 17 et 24, et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 

5 proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison 
au retinol, du precurseur de Factivateur du ganglioside GM2, de la calgranuline B et de 
la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 
10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29), et les sequences peptidiques qui 
presentent au moins 70 % d'identite de preference au moins 80 % d'identite et 
10 avantageusement au moins 98 d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° 1 a 29, independamment ou en combinaison, 

(iv) soit au moins une sequence d'acide nucleique comprenant au moins 
un gene d'interet therapeutique dont la sequence nucleique est deduite des sequences 
d'ADN et d'AJRN codant pour tout ou partie des proteines dont les sequences sont 

15 referencees SEQ ID N° 2, 4, 8, 9, 17 et 24, et les sequences d'ADN et/ou ARN (par 
exemple SEQ ID N° 30 a 57) codant pour tout ou partie des proteines appartenant a une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proline 
plasmatique de liaison au retinol, du precurseur de Factivateur du GM2, de la 
calgranuline B et de la saposine B, en association avec des elements assurant 

20 Fexpression dudit gene d'interet therapeutique in vivo dans des cellules cibles destinees 
a etre genetiquement modifiees par la sequence nucleique du gene d'interet 
therapeutique, 

(v) soit au moins une cellule de mammifere ne produisant pas 
naturellement la proteine d'interet ou les proteines d'interet ou tout fragment de cette 

25 ou de ces proteine(s) ou des anticorps specifiques d'au moins une desdites proteines ou 
de ses fragments ladite cellule mammifere etant genetiquement modifi£e in vitro par au 
moins une sequence d'acide nucleique ou un fragment d'une sequence d'acide 
nucleique ou une association de sequences d'acides nucleiques correspondant a des 
fragments d'acides nucleiques issus d'un meme gene ou de genes differents, la ou 

30 lesdites sequences nucleiques etant deduite(s) des sequences d'ADN et ARN codant 
pour les proteines referencees SEQ ID N° 2, 4, 8, 9, 17 et 24, et les sequences d'ADN 
et/ou ARN (par exemple SEQ ID N° 30 a 57) codant pour tout ou partie des proteines 
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appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur 
de la proteine plasmatique de liaison au retinol, du precurseur de 1' activateur du GM2, 
de la calgranuline B et de la saposine B, ledit gene d'interet therapeutique codant pour 
tout ou partie de la proteine d'interet, d'un fragment de la proteine d'interet ou d'un 
anticorps specifique de la proteine d'interet qui sera exprime a la surface de ladite 
cellule de mammifere (Toes et ah, 1997,PNAS 94: 14660-14665). La composition 
pharmaceutique peut contenir un agent therapeutique seul dirige contre une cible seule 
ou des agents pris en combinaison diriges contre plusieurs cibles. 

On designe par « polypeptides et/ou proteines d'interet de 1'invention » le 
fragment Oterminal du perlecan (SEQ ID N° 2), le precurseur de la proteine 
plasmatique de liaison au retinol (SEQ ED N°4), la proteine activateur du GM2 (SEQ 
ID N° 8), la proteine mutee de l'activateur du GM2 (SEQ ID N° 9), la calgranuline B 
(SEQ ID N° 17), la saposine B (SEQ ID N° 24), les proteines ou fragments appartenant 
a la famille du precurseur de la proteine plasmatique de liaison au retinol (par exemple 
SEQ ID N° 5 a 7), les proteines ou fragments appartenant a la famille de la proteine 
activateur du GM2 (par exemple SEQ ID N° 10 a 16), les proteines ou fragments 
appartenant a la famille de la proteine calgranuline B (par exemple SEQ ID N° 18 a 
23), les proteines ou fragments appartenant a la famille de la proteine saposine B (par 
exemple SEQ ED N° 25 a 29 et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 % 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29. 

A partir des connaissances des sequences en acides amines des proteines 
d'interet identifies dans la presente invention, il est a la portee de Phomme de l'art de 
definir et utiliser les molecules decrites ci dessus et/ou toute molecule capable de se 
fixer au dites molecules, et/ou toute molecule capable d'inhiber lesdites molecules. 
Ainsi la presente invention concerne 1 'utilisation de proteines naturelles et/ou 
recombinantes et/ou de polypeptides de synthese et leurs fragments, de ligand capables 
de se fixer au dites proteines ou a leur(s) fragment(s), par exemple des anticorps ; de 
proteines inhibitrices de la fonction et/ou de l'expression et/ou de la fixation desdites 
proteines. 
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Utilisation de proteine(s) et/ou peptide(s) naturel(s) et/ou de proteine(s) 
recombinante(s) et/ou de polypeptide(s) de synthese correspondant aux proteines 
d'interet identifies dans la presente invention. 

La presente invention concerne un materiel biologique pour la preparation 
de compositions pharmaceutiques destinees au traitement de mammiferes atteint de 
maladie auto-immune, de preference la sclerose en plaques, comprenant : 

(i) soit au moins une proteine naturelle et/ou une proteine recombinante 
et/ou un polypeptide de synthese choisi parmi les proteines dont les sequences en 
acides amines sont referencees SEQ ID N° 2, 4, 8, 9, 17 et 24, et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison 
au retinol du precurseur de l'activateur du ganglioside GM2, de la calgranuline B et de 
la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 
10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29), et les sequences peptidiques qui 
presentent au moins 70 % d'identite de preference au moins 80 % d'identite et 
avantageusement au moins 98 d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° 1 a 29, seules ou en combinaison, 

(ii) soit au moins un fragment naturel et/ou synthetique de ces proteines 
d'interet, par exemple un fragment immunogene capable d'induire une reponse 
immune contre un polypeptide cible, 

(iii) soit au moins un peptide mimotope defini a partir des sequences de 
reference SEQ ID N°"2, 4, 8, 9, 17 et 24 et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur 
de l'activateur du ganglioside GM2, de la calgranuline B et de la saposine B (par 
exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 
18 a 23, SEQ ID N° 25 a 29), et les sequences peptidiques qui presentent au moins 70 
% d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, ou une 
combinaison de mimotopes, capable d'induire une reponse immune contre le 
polypeptide cible, 
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(iv) soit au moins toute proteine ou peptide pouvant reguler in vivo la 
transcription et/ou la traduction des proteines d'interet (SEQ ID N° 2, 4, 8, 9, 17 et 24) 
et les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de 
la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID 
N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 1 a 29. L'administration de ces proteines et/ou 
peptides seuls ou en combinaison peut retablir la concentration d'une proteine d'interet 
dans I'organisme. 

La reponse immune dirigee contre un antigene specifique peut etre divisee 
en deux categories distinctes, Tune mettant en jeu les anticorps (reponse immune de 
type humorale), r autre les cellules effectrices cytotoxiques telles que par exemple les 
macrophages, les lymphocytes cytotoxiques (CTL) ou les cellules tueuses (NK) ainsi 
que les lymphocytes T « helper », notamment les lymphocytes T CD4+ (reponse 
immune de type cellulaire). Plus particulierement, les deux types de reponse se 
distinguent en ce que les anticorps reconnaissent les antigenes sous leur forme 
tridimensionnelle alors que les lymphocytes T, par exemple, reconnaissent des portions 
peptidiques desdits antigenes, associes a des giycoproteines codees par les genes du 
complexe majeur d'histocompatibilite (CMH), notamment les genes du complexe 
majeur d'histocompatibiiite de type I qui sont exprimes de fa9on ubiquitaire a la 
surface des cellules ou les genes du complexe majeur d'histocompatibiiite de type II 
qui sont exprimes de fa<?on specifique a la surface des cellules impliquees dans la 
presentation des antigenes (APC). 1) Selon un premier aspect, la reponse immune de 
type cellulaire est caracterisee en ce que les cellules T de type CD4+ (cellules T 
helper), suite a un phenomene d'activation bien connu (pour une revue voir Alberola- 
lia 1997, Annu Rev Immunol 15, 125-154) produisent des cytokines qui a leur tour 
induisent la proliferation de cellules APC capables de produire lesdites cytokines, la 
differenciation cellulaire des lymphocytes B capables de produire des anticorps 
specifiques de Tantigene, et la stimulation des lymphocytes T cytotoxiques (CTL). 2) 
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Selon un second aspect de la reponse immune cellulaire, les cellules effectrices 
cytotoxiques telles que par exemple les lymphocytes de type CD8+ (CTL) sont actives 
a) apres interaction avec des peptides antigeniques fixes sur et presentes par les 
glycoproteins portees par les cellules ubiquitaires et codees par les genes appartenant 
5 au systeme CMHI, et b) eventuellement par les cytokines produites par les CD4-K 

La presente invention concerne P administration d'une proteine ou d'un 
peptide derives des proteines d'interet (SEQ ID N° 2, 4, 8, 9, 17 et 24) ou de leur(s) 
fragment(s), et les sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur 

10 de la proteine plasmatique de liaison au retinol, du precurseur de Factivateur du 
ganglioside GM2, de la calgranuline B et de la saposine B (par exemple SEQ ED N°l, 
SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 
25 a 29), et les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 % d'identite avec 

15 Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, seuls ou en 
combinaison, pour la prophylaxie et/ou la therapie d'une maladie auto-immune, telle 
que la sclerose en plaques. Ces proteines et peptides administres sont caracterises en ce 
que ils doivent avoir perdu leur activite toxique, par exemple leur activite gliotoxique, 
ou avoir perdu leur capacite a se fixer a un ligand, et peuvent induire significativement 

20 une reponse immune mediee par les lymphocytes T ou/et les anticorps dirigee contre 
cette proteine sont utilises. De telles proteines sont dites 'modifiees\ cependant leur 
immunogenicite est conservee. De telles molecules immunogeniques modifiees sont 
obtenues par un nombre de traitements conventionnels, par exemple la denaturation 
chimique ou a la chaleur, la troncation ou la mutation avec deletion, insertion ou 

25 emplacement d'acides amines. Un exemple de troncation consiste en la troncation 
d'acides amines a rextremite carboxy-terminale pouvant aller jusqu'a 5-30 acides 
amines. Les molecules modifiees peuvent etre obtenues par des techniques synthetiques 
ou/et recombinantes ou par des traitements chimiques ou physiques des molecules 
naturelles. 

30 Les proteines d'interet naturelles et/ou recombinantes identifiees dans la 

presente invention (SEQ ID N° 2, 4, 8, 9, 17 et 25), et les sequences peptidiques ou les 
fragments desdites sequences appartenant a une meme famille de proteines choisies 
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parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B 
(par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ 
ID N° 18a 23, SEQ ID N° 25 a 29), et les sequences peptidiques qui presentent au 
5 moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 
moins 98 d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 
29, ou leur(s) fragment(s), sont uti Usees en vaccination prophylactique et therapeutique 
contre les maladies auto-immunes, de preference la SEP. Un vaccin comprend une 
quantite immunogenique effective de la proteine immunogene en association avec un 

10 vehicule pharmaceutiquement acceptable et eventuellement un adjuvant et/ou un 
diluant. Les vehicules, adjuvants et diluants pharmaceutiquement acceptables sont bien 
connus de Fhomme du metier. On peut citer a titre de reference le Remington's 
Pharmaceutical Sciences. L'utilisation de compositions vaccinales est particulierement 
avantageuse en association avec un diagnostic precoce de la maladie. La proteine 

15 immunogene est utilisee dans la preparation de medicament pour la vaccination 
prophylactique ou therapeutique. Les proteines d'interet peuvent etre eliminees de 
l'organisme sans induire d'effets secondaires indesirables. L' identification de telles 
proteines ou peptides vaccins est realisee comme suit: les molecules candidates 
modifiees comme decrit precedemment (proteines naturelles, recombinantes, peptides) 

20 sont analysees dans un test fonctionnel pour verifier qu'elles ont perdues leur toxicite, 
par exemple leur activite gliotoxique en utilisant le test appele bio-essai, et pour 
verifier leur immunogenicite (i) en realisant un test in vitro de proliferation de 
lymphocytes T CD4+ specifiques de Tantigene administre (T cell assay) ou un test in 
vitro de cytotoxicite des lymphocytes CD8+ specifiques de Tantigene administre et (ii) 

25 en mesurant entre autre le taux d'anticorps circulants diriges contre la proteine 
naturelle. Ces formes modifiees sont utilisees pour immuniser des hommes par des 
procedures standard avec des adjuvants appropries. 

Les vaccins prepares sont injectables, c'est-a-dire en solution liquide ou 
en suspension. En option, la preparation peut aussi etre emulsifiee. La molecule 

30 antigenique peut etre melangee avec des excipients qui sont pharmaceutiquement 
acceptables et compatibles avec ['ingredient actif. Des exemples d'excipients 
favorables sont l'eau, une solution saline, le dextrose, le glycerol, Tethanol ou des 
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equivalents et leurs combinaisons. Si desire, le vaccin peut contenir des quantites 
mineures de substances auxiliaires comme des agents " wetting " ou emulsifiants, des 
agents qui tamponnent le pH ou des adjuvants comme I'hydroxide d'aluminium, le 
dipeptide muramyl ou leurs variations. Dans le cas des peptides, leur couplage a une 
5 plus grosse molecule (KLH, toxine tetanique) augmente quelquefois Fimmunogenicite. 
Les vaccins sont administres conventionnellement par injection par exemple sous 
cutanee ou intramusculaire. Des formulations additionnelles favorables avec d'autres 
modes d' administration incluent des suppositoires et quelquefois des formulations 
orales. 

10 En general la concentration du polynucleotide dans la composition utilisee 

pour une administration in vivo est de 0.1 ug /ml jusqu'a 20 mg /ml. Le polynucleotide 
peut etre homologue ou heteroiogue de la cellule cible dans laquelle il va etre introduit. 

La presente invention concerne egalement r utilisation de vaccins incluant 
des molecules d'acides nucleiques qui codent pour les proteines d'interet ou des 

15 peptides immunogenes ou leur fragment(s), non actifs, correspondant aux proteines 
d'interet (SEQ ID N° 2, 4, 8, 9, 17 et 24) et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une merne famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur 
de l'activateur du ganglioside GM2, de la calgranuline B et de la saposine B (par 

20 exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 
18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 % 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29. Les 
vaccins decides nucleiques, en particulier les vaccins ADN, sont administres 

25 generalement en association avec un vehicule pharmaceutiquement acceptable en 
injection intramusculaire. 

A partir de la sequence en acides amines des proteines d'interet decrites 
(SEQ ID N° 2, 4, 8, 9, 17 et 24) et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 

30 precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Pactivateur du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple 
SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 1 8 4 23, 
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SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 % 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, des 
peptides ou des fragments correspondant a tout ou partie de la sequence primaire de ces 
5 proteines peuvent etre synthetises par des methodes classiques de synthese peptidique 
ou obtenus par recombinaison genetique. 

Des proteines recombinantes correspondante aux proteines d'interet, 
produites dans un systeme cellulaire procaryote ou eucaryote, sont disponibles aupres 
de differentes equipes et sont decrites dans la litterature. Elles peuvent etre egalement 

10 produite par Fhomme du metier a partir de la connaissance des sequences des genes 
correspondants decrits dans la litterature et en tenant compte de la degenerescence du 
code genetique. Toutes les sequences proteiques identifiees dans la presente invention 
sont ainsi susceptibles d'etre obtenues par recombinaison genetique. Les genes sont 
clones dans des vecteurs adaptes. Des vecteurs dififerents sont utilises pour transformer 

15 des cellules procaryotes (par exemple E. coli) et des cellules eucaryotes (par exemple 
cellules COS, CHO et cellules Simliki). Les proteines recombinantes correspondant 
aux proteines d'interet ou a des fragments des proteines d'interet peuvent etre ainsi 
produits dans des systemes cellulaires procaryotes et/ou encaryotes. Dans les cellules 
E. coli, les proteines recombinantes sont produites avec une queue poly-histidine. La 

20 fraction proteique insoluble est solubilisee dans de l'uree 8M. L'enrichissement du 
produit a ete effectue sur resine chelatee au nickel (Qiagen). La colonne a ete lavee 
avec des concentrations decroissantes d'uree. L'elution a ete faite avec de Timidazole 
en Tabsence d'uree. La sequence complete des proteines d'interet peut etre egalement 
clonee dans un plasmide adapte puis transferee dans le virus de la vaccine pour obtenir 

25 un virus recombinant. 

Utilisation de ligands capables de se fixer aux proteines d'interet 
identifiees dans la presente invention. 

La presente invention concerne un materiel biologique pour la preparation 
de compositions pharmaceutiques destinees au traitement de mammiferes atteint de 

30 maladie auto-immune, de preference la sclerose en plaques, comprenant : 

(i) soit au moins un ligand capable de se fixer aux proteines et/ou 
fragments des proteines choisies parmi les proteines cibles SEQ ID N° 2, 4, 8, 9, 14 et 
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24 et les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de l'activateur du ganglioside GM2, de 
la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID 
N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 1 a 29, le ligand etant capable ou non d'inhiber 
l'activite proteique, 

(ii) soit au moins un anticorps polyclonal ou monoclonal capable de se 
fixer a au moins une proteine ou un de ses fragments choisie parmi les proteines cibles 
SEQ ID N° 2, 4, 8, 9, 14 et 24 et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
1'activateur du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple 
SEQ ID N°l , SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, 
SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 % 
d'identite avec l'une quelconque des sequences peptidiques SEQ ID N° 1 a 29. Cet 
anticorps peut etre ou non neutralisant, c'est-a-dire capable ou non d'inhiber l'activite 
de la proteine d'interet. Le ligand peut etre choisi parmi toute molecule ou fragment 
molecule capable de se fixer aux proteines cibles, par exemple les recepteurs de ce 
proteines, les cofacteurs de ces proteines, les anticorps polyclonaux ou monoclonaux 
capables de se fixer aux proteines ou tout fragment de ces proteines. 

Ces anticorps sont tres utiles notamment pour permettent la mise en oeuvre 
de compositions therapeutiques car ils conduisent par exemple, a des reactions 
immunes, dirigees specifiquement a l'encontre d'epitopes immunodominants ou contre 
des antigenes presentant une grande variabilite. On administre chez le patient soit des 
anticorps solubles neutralisants pour inhiber leur fonction, soit des anticorps solubles 
specifiques pour eliminer le peptide par formation de complexes immuns. L'invention 
decrit l'utilisation d'anticorps capables de reconnaitre specifiquement au moins une 
proteine decrite dans la presente invention pour le traitement et /ou pour le suivi 
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therapeutique de maladie degenerative et/ou neurologique et/ou auto-immune, de 
preference la sclerose en plaques. Ces anticorps sont polyclonaux et de preference 
monoclonaux. De preference ces anticorps reconnaissent le site actif de la proteine et 
en se fixant, inhibe la fonction de la proteine. La capacite de I 'anticorps a se fixer 
5 specifiquement a la proteine est analyse par des techniques conventionnelle decrites, 
comme par exemple par des tests ELISA ou de Western blot en utilisant la proteine ou 
le peptide immunogene naturel ou synthetique. Le titre de V anticorps est determine. La 
capacite de l'anticorps a neutraliser la fonction de la proteine peut etre analysee par 
differents moyen, par exemple en determinant la diminution de Tactivite de la proteine 

10 ou du peptide immunogene en presence de l'anticorps, de preference en determinant la 
diminution de l'activite gliotoxique en utilisant le test bio-essai in vitro. 

Par exemple, les anticorps monoclonaux diriges centre la proteine cible ou 
une partie de cette proteine sont produits par des techniques conventionnelles utilisees 
pour produire des anticorps contre des antigenes de surface Des souris ou des lapins 

15 sont immunisees (i) soit avec la proteine naturelle ou recombinante d'interet, (ii) soit . 
avec tout peptide immunogene de cette proteine d'interet, (iii) soit avec des cellules 
murines qui expriment la proteine ou le peptide d'interet et les molecules du CMHH. 
La lignee murine Balb/c est la plus frequemment utilisee. L'immunogene est egalement 
un peptide choisi parmi les peptides definis a partir des sequences primaires des 

20 proteines d'interet. Par exemple, 1' immunogene suivant a ete prepare : les peptides 
SEQ ID N°s 58, 59, 60 issus de la sequence du precurseur du ganglioside GM2, les 
peptides SEQ ID N°s 61, 62 issus de la sequence de la saposine B et les peptides SEQ 
ID N°s 63, 64, 65 issus de la calgranuline B ont ete couple a de l'hemocyanine de 
Lymphet Keyhole, en abrege peptide-KLH, comme support pour son utilisation en 

25 immunisation, ou couple a de Talbumine de serique humaine, en abrege peptide-HSA. 
Les animaux ont ete soumis a une injection de peptide-KLH ou de peptide-HSA en 
utilisant de Padjuvant complet de Freund (IF A). Les serums et les surnageants de 
culture d'hybridome issus des animaux immunises avec chaque peptide ont ete 
analyses pour la presence d'anticorps anti-proteines par un test ELISA utilisant les 

30 proteines initiales. Les cellules spleniques de ces souris ont par consequent ete 
recuperees et fusionnees avec des cellules de myelome. Le polyethyleneglycol (PEG) 
est Fagent de fusion le plus frequemment utilise. Les hybridomes produisant les 
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anticorps les plus specifiques et les plus sensibles sont selectionnes. Les anticorps 
monoclonaux peuvent etre produits in vitro par culture cellulaire des hybridomes 
produits ou par recuperation de Iiquide d'ascite murin apres injection intraperitoneale 
des hybridomes chez la souris. Quel que soit le mode de production en surnageant ou 
en ascite, il importe ensuite de purifier l'anticorps monoclonal. Les methodes de 
purification utilisees sont essentiellement la filtration sur gel echangeur d'ions ou par 
chromatographic d'exclusion, voire Pimmunoprecipitation. Pour chaque anticorps il 
faut choisir la methode qui permettra d'obtenir le meilleur rendement. Un nombre 
suffisant d'anticorps anti-proteines sont cribles dans des tests fonctionnels pour 
identifier les anticorps les plus performants pour fixer la proteine d'interet et/ou pour 
bloquer Pactivite de la proteine d'interet. Les anticorps monoclonaux selectionnes sont 
humanises par des methodes standard de « CDR grafting » (protocole realise par de 
nombreuses compagnies, sous forme de service). Ces anticorps humanises peuvent etre 
testes cliniquement chez le patient. L'efficacite de ces anticorps peut etre suivie par des 
parametres cliniques. 

La production in vitro d'anticorps, de fragments d'anticorps ou de derives 
d'anticorps, tels que les anticorps chimeres, produits par genie genetique, dans des 
cellules eucaryotes a ete decrite (EP 120 694 ou EP 125 023) et est aussi applicable a la 
presente invention. 

Utilisation de molecules inhibitrices des proteines d'interet identifiees 
dans la presente invention. 

La presente invention concerne un materiel biologique pour la preparation 
de compositions pharmaceutiques destinees au traitement de mammiferes atteint de 
maladie degenerative et/ou neurologique et/ou auto-immune, de preference la sclerose 
en plaques, ladite composition comprenant (i) soit au moins une molecule inhibitrice de 
la fonction d'au moins une proteine choisie parmi les proteines identifiees dans la 
presente invention (SEQ ID N° 2, 4, 8, 9, 17, 24) et les sequences peptidiques ou les 
fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de 1'activateur du ganglioside GM2, de la calgranuline B et de la saposine B 
(par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ 
ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au 
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moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 
moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 
29, par exemple inhibitrice de Factivite gliotoxique, (ii) soit au moins une molecule 
regulatrice de Fexpression d'au moins une proteine choisie parmi les proteines SEQ ID 
5 N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur 
de la proteine plasmatique de liaison au retinol, du precurseur de Factivateur du 
ganglioside GM2, de la calgranuline B et de la saposine B (par exemple SEQ ED N°l, 
SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 

10 25 a 29) et les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 % d'identite avec 
Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, par exemple pour 
bloquer la transcription ou la traduction, (iii) soit au moins une molecule regulatrice du 
metabolisme d'au moins une proteine choisie parmi les proteines SEQ ID N° 2, 4, 8, 9, 

15 17, 24 et les sequences peptidiques ou les fragments desdites sequences appartenant a 
une meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de Factivateur du ganglioside GM2, de 
la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID 
N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences 

20 peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 1 a 29, (iv) soit au moins une molecule regulatrice 
de Fexpression et/ou du metabolisme d'un ligand d'au moins une proteine choisie 
parmi les proteines SEQ ID N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les 

25 fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de Factivateur du ganglioside GM2, de la calgranuline B et de la saposine B 
(par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ 
ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au 

30 moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 
moins 98 % d'identite avec Fune quelconque des sequences peptidiques SEQ ID N° 1 a 
SEQ ID N° 8 et SEQ ID N° 10 a 29 et les sequences peptidiques qui presentent au 
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moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 
moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 
29, par exemple un recepteur ou un cofacteur. On peut penser que ces proteines de 
l'organisme humain peuvent etre inhibees sans effet secondaire. 
5 Un autre aspect important de l'invention conceme Identification et 

revaluation de 1'efficacite therapeutique de substances naturelles et/ou synthetiques (i) 
capables de bloquer et/ou d'inhiber l'activite des proteines d'interet de l'invention 
et/ou de leur fragment : SEQ ID N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les 
fragments desdites sequences appartenant a une raeme famille de proteines choisies 

10 parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de l'activateur du ganglioside GM2, de la calgranuline B et de la saposine B 
(par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ 
ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au 
moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 

15 moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 
29 et/ou (ii) capables d'inhiber leur metabolisme tels les inhibiteurs du metabolisme 
correspondant, les inhibiteurs d'enzymes activees par les coenzymes, (iii) capables de 
reguler l'expression des proteines d'interet (SEQ ID N° 2, 4, 8, 9, 17, 24 et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 

20 famille de proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de l'activateur du ganglioside GM2, de la 
calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID 
N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ED N° 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 

25 d'identite et avantageusement au moins 98 % d'identite avec 1'une quelconque des 
sequences peptidiques SEQ ID N° 1 a 29, (iv) capables d'inhiber la fonction et/ou 
l'expression des ligands des proteines d'interet SEQ ID N° 2, 4, 8, 9, 17, 24 et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique 

30 de liaison au retinol, du precurseur de l'activateur du ganglioside GM2, de la 
calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID 
N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences 
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peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 1 a 29, comme par exemple des recepteurs. Ces 
substances peuvent etre utilisees dans des traitements prophylactiques et therapeutiques 
5 de la maladie. L'invention conceme egalement des methodes pour traiter et prevenir 
une maladie auto-immune, par exemple la SEP, en administrant des quantites effectives 
de ces substances. Les substances peuvent etre des proteines, des anticorps, de petites 
molecules synthetiques ou naturelles, des derives des proteines identifiees dans cette 
invention, des lipides, des glycolipides etc... Les petites molecules peuvent etre criblees 

10 et identifiees en grande quantite en utilisant des librairies combinatoires chimiques. 
L'invention conceme egalement des compositions pharmaceutiques comprenant ces 
substances en association avec des carriers physiologiques acceptables, et des methodes 
pour la preparation de medicaments a utiliser en therapie ou en prevention de maladies 
auto-immunes dont la SEP en utilisant ces substances. 

15 Pour identifier des molecules inhibitrices de faible poids moleculaire 

comme des drogues candidates pour les maladies degeneratives et/ou neurologiques 
et/ou auto-immunes, telles que la sclerose en plaques, on utilise les tests et protocoles 
decrits dans precedemment et dans les demandes de brevet incorpores a titre de 
reference, en utilisant des echantillons preleves du patient non traite ou traite, du 

20 modele animal non traite ou traite, ou de tissus du modele animal non traite ou traite. 
Cet aspect de P invention inclue egalement un precede pour identifier des substances 
capables de bloquer ou d'inhiber Pactivite des proteines d'interet, comprenant 
Pintroduction de ces substances dans un test in vitro ou dans un modele animal in vivo. 
Les molecules selectionnees sont testees a differentes concentrations. Ces inhibiteurs 

25 sont aussi testes dans des essais de toxicite et pharmacocin&ique pour savoir si ils 
peuvent representer des drogues candidates valables. Les substances testees pour 
Pinhibition ou le blocage des activites proteiques ou de Pexpression des proteines, 
dans ces procedures de criblage peuvent etre des proteines, des anticorps, des 
fragments d'anticorps, de petites molecules synthetiques ou naturelles, des derives des 

30 proteines d'interet, etc Les petites molecules peuvent etre criblees et identifiees en 

grande quantite en utilisant des librairies combinatoires chimiques. 

A titre d'exemple, on peut citer comme substances inhibitrices : 
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Les inhibiteurs des proteines identifies dans la presente invention (SEQ 
ID N° 2, 4, 8, 9, 1 7, 24), les sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur 
de la proteine plasmatique de' liaison au retinol, du precurseur de 1'activateur du 
5 ganglioside GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N°l, 
SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 
25 a 29) et les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 % d'identite avec 
Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les inhibiteurs des 

10 fragments desdites proteines. Ces inhibiteurs peuvent etre compris dans une 
composition prophylactique et therapeutique, en particulier pour le traitement de la 
sclerose en plaques. Par exemple, la lycorine, alcaloide extrait de Amaryllidaceae (ex : 
Crinum Asiaticum) est utilisee in vitro a une concentration comprise entre 0.1 et 0.5 \ig 
/ml et in vivo a une concentration comprise entre 0.1 et 1 mg / kg /jour. Par exemple, le 

15 Rolipram (nom commercial) et l'lbudilast (nom commercial), qui sont deux molecules 
de la meme famille des inhibiteurs des phosphodiesterases 4(PDE4) sont utilisees in 
vitro a des concentrations comprises entre 1 et 10 nM/1 et in vivo a des concentrations 
comprises entre environ 10 mg/kg/jour. 

~ A partir des sequences d'acides amines des proteines SEQ ID N° 2,_4, 

20 8, 9, 17, 24_et des sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur 
de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur du 
ganglioside GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N°l, 
SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 

25 25 a 29XJ1 est evident que Ton peut deduire les sequences nucleotidiques ADN et 
ARN (SEQ ID N° 30, 31, 42, 53) correspondant aux proteines d'interet et les sequences 
codant pour les proteines de la famille de ces proteines d'interet ( par exemple SEQ ID 
N° 32 a 41, SEQ ID N° 43 a 52, SEQ ID N° 54 a 57, SEQ ID N° 66 a 67), en tenant 
compte du code genetique et de sa degenerescence. Ainsi la presente invention 

30 concerne Futilisation de ces sequences nucleotidiques sous forme : 

- de sequences anti-sens, 

- de sequences codant pour un gene therapeutique, 
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- de sequences pouvant etre contenue dans un vecteur pour la realisation 
de transformation cellulaire ex vitro et/ou in vivo (therapie genique). 

Utilisation d'acides nucleiques deduits des sequences en acides amines 
des proteines d'interet identifies dans la presente invention ; acides nucleiques anti- 
5 sens et/ou codant pour un gene therapeutique. 

La presente invention concerne un materiel biologique pour la preparation 
de compositions pharmaceutiques destinees au traitement de mammiferes atteint de 
maladie degenerative et/ou neurologique et/ou auto-immune, en particulier la sclerose 
en plaques, la composition comprenant (i) soit au moins une sequence d'acide 

10 nucleique capable de s'hybrider a une sequence d'acides nucleiques codant pour les 
proteines d'interet (SEQ ID N° 2, 4, 8, 9, 17, 24) et les sequences peptidiques ou les 
fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de l'activateur du ganglioside GM2, de la calgranuline B et de la saposine B 

15 (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ 
ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au 
moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 
moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 
29, ou leur(s) fragment(s), (ii) soit au moins une sequence d'acide nucleique 

20 comprenant au moins un gene d'interet therapeutique codant pour les proteines ou un 
fragment de proteines (SEQ ID N° 2, 4, 8, 9, 17, 24), les sequences peptidiques ou les 
fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de l'activateur du ganglioside GM2, de la calgranuline B et de la saposine B 

25 (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ 
ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au 
moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 
moins 98 % d'identite avec l'une quelconque des sequences peptidiques SEQ ID N° 1 a 
29, et des elements assurant l'expression dudit gene in vivo dans des cellules cibles 

30 destinees a etre genetiquement modifiees par ladite sequence nucleique. 

Par sequence d'acide nucleique, on entend un fragment d'ADN et/ou 
d'ARN, double brin ou simple brin, lineaire ou circulaire, naturel et isole ou de 
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synthese, designant un enchainement precis de nucleotides, modifies ou non, 
permettant de definir un fragment ou une region d'un acide nucleique choisi dans le 
groupe consistant en un ADNc ; un ADN genomique ; un ADN plasmidique ; un ARN 
messager. Ces sequences d'acides nucieiques sont deduites de la sequence d'acides 
5 amines des proteines SEQ ID N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les 
fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de l'activateur du ganglioside GM2, de la calgranuline B et de la saposine B 
(par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ 

10 ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au 
moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 
moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 
29, en utilisant le code genetique. En raison de la degenerescence du code genetique 
F invention englobe egalement des sequences equivalentes ou homologues. Ces 

15 sequences definies permettent a rhomme de Fart de definir lui-meme les acides 
nucieiques adaptes. 

Aussi, la presente invention conceme un materiel biologique pour la 
preparation de compositions pharmaceutiques comprenant au moins une sequence 
d'acide nucleique capable de s'hybrider a une sequence d'acides nucieiques codant 

20 pour les proteines d'interet ou leur(s) fragment(s) (SEQ ID N° 2, 4, 8, 9, 17, 24) et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de l'activateur du ganglioside GM2, de la 
calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID 

25 N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 % d'identite avec Fune quelconque des 
sequences peptidiques SEQ ID N° 1 a 29. 

L'invention consiste a definir et utiliser des molecules d'acides nucieiques 

30 complementaires des sequences ADN et/ou ARN codant pour les proteines d'interet ou 
leur(s) fragment(s). Ces fragments correspondent a des molecules anti-sens ou 
ribozyme et peuvent etre synthetises a 1'aide de synthetiseurs automatiques, tels que 
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ceux commercialises par la societe Applied Biosystem. L'invention decrit Putilisation 
de ces acides nucleiques capables de s'hybrider dans des conditions stringentes a 
PADN ou/et ARN codant pour les proteines de Pinvention ou pour leu(s) fragment(s). 
Des conditions de stringence caracteristiques sont celles qui correspondent a une 
combinaison de la temperature et de la concentration saline choisie approximativement 
entre 12 a 20°C sous le Tm (« melting temperature ») de Phybride a P etude. De telles 
molecules sont synthetisees et peuvent etre marquees en utilisant des methodes de 
marquage conventionnelles utilisees pour les sondes moleculaires, ou peuvent etre 
utilisees comme amorces dans les reactions d'amplification. Les sequences qui 
presentent au moins 90% d'homologie par rapport a une sequence de reference font 
egalement partie de Pinvention, de meme que les fragments de ces sequences qui 
presentent au moins 20 nucleotides et de preference 30 nucleotides contigus 
homologues par rapport a une sequence de reference. Afin de reduire la proportion de 
peptides naturels ou variants, il est possible d'envisager une approche anti-sens et/ou 
ribozyme. Une telle approche est largement decrite dans la literature. Bien entendu, de 
telles molecules anti-sens peuvent constituer en tant que telles des vecteurs. On peut 
egalement utiliser des vecteurs qui comprennent une sequence d'acides nucleique qui 
code pour un anti-sens. 

La presente invention concerne un materiel biologique pour la preparation 
de compositions pharmaceutiques destinees au traitement de mammiferes atteint de 
maladie degenerative et/ou neurologique et/ou auto-immune, telle que la sclerose en 
plaques, ladite composition comprenant au moins une sequence d'acide nucleique 
contenant au moins un gene d'interet therapeutique et des elements assurant 
P expression dudit gene in vivo dans des cellules cibles destinees a etre genetiquement 
modifiees par ladite sequence nucleique. 

Ces sequences d' acides nucleiques et/ou vecteurs (anti-sens ou codant 
pour une proteine ou un fragment d'une proteine) permettent de cibler les cellules dans 
lesquelles le peptide est exprime, telles que les cellules macrophages : (i) soit par 
Putilisation d'une molecule de ciblage introduite sur le vecteur, (ii) soit par Putilisation 
d'une propriete particuliere de ces cellules. 

Utilisation de vecteurs comprenant un gene d'interet therapeutique 
correspondant aux genes des proteine d'intdret identifiees dans la presente invention. 
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La presente invention concerne un materiel biologique pour la preparation 
de compositions pharmaceutiques destinees a la prevention et au traitement de 
maladies degenerative et/ou neurologique et/ou auto-immune, telles que la sclerose en 
plaques, la composition comprenant une sequence d'acide nucleique comprenant un 
5 gene d'interet therapeutique et des elements d'expression dudit gene d'interet. Les 
genes peuvent etre non mutes ou mutes. lis peuvent egalement consister en des acides 
nucleiques modifies de sorte qu'il ne leur est pas possible de s'integrer dans le genome 
de la cellule cible ou des acides nucleiques stabilises a l'aide d'agents, tels que la 
spermine. 

10 Un tel gene d'interet therapeutique code notamment : 

(i) soit au moins pour une proteine choisie parmi les proteines identifiees 
dans la presente invention (SEQ ID N° 2, 4, 8, 9, 17, 24) et les sequences peptidiques 
ou les fragments desdites sequences appartenant a une meme famille de proteines 
choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison au 

15 . retinol, du precurseur de 1'activateur du ganglioside GM2, de la calgranuline B et de la 
saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ED N° 10 
a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui 
presentent au moins 70 % d'identite de preference au moins 80 % d'identite et 
avantageusement au moins 98 % d'identite avec Tune quelconque des sequences 

20 peptidiques SEQ ID N° 1 a 29, ou leur(s) fragment(s), 

(ii) soit au moins pour tout ou partie d'un anticorps polyclonal ou 
monoclonal capable de se fixer a au moins une proteine ou un fragment de proteine 
choisi parmi les proteines identifiees dans la presente invention (SEQ ID N° 2, 4, 8, 9, 
17, 24) et les sequences peptidiques ou les fragments desdites sequences appartenant a 

25 une meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de 1'activateur du ganglioside GM2, de 
la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID 
N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 1 8 a 23, SEQ ID N° 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 

30 d'identite et avantageusement au moins 98 % d'identite avec l'une quelconque des 
sequences peptidiques SEQ ID N° 1 a 29. II peut notamment s'agir d'anticorps 
transmembranaire natif, ou de fragment ou derive d'un tel anticorps, pour autant que 
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ledit anticorps, fragment ou derive d'anticorps soit exprime a la surface de la cellule 
cible du mammifere genetiquement modifiee et soit capable de se fixer a un 
polypeptide present a la surface d'une cellule effectrice cytotoxique ou d'un 
lymphocyte T helper implique dans le procede d'activation d'une telle cellule, 

(iii) soit au moins pour une molecule inhibitrice d'au moins une proteine 
ou de ses fragments, ladite proteine etant choisie parmi les proteines identifiees (SEQ 
ID N° 2, 4, 8, 9, 17, 24) et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Factivateur du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple 
SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, 
SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 % 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29; les 
proteines inhibitrices de la fonction et/ou du metabolisme et/ou de la fixation des 
proteines SEQ ID N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur 
de Factivateur du ganglioside GM2, de la calgranuline B et de la saposine B (par 
exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 
18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 % 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, 

(iv) soit au moins pour un ligand ou toute partie d'un ligand capable de se 
fixer a au moins une proteine ou un fragment de proteine choisi parmi les proteines 
identifiees (SEQ ID N° 2, 4, 8, 9,17, 24) et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur 
de Factivateur du ganglioside GM2, de la calgranuline B et de la saposine B (par 
exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 
1 8 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 % 
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d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, et/ou 
d'inhiber sa fonction. 

Plus particulierement, par fragment d'anticorps, on entend les fragments 
F(ab)2, Fab', Fab, sFv (Blazar et al., 1997, Journal of Immunology 159 : 5821-5833 ; 
5 Bird et al., 1988 Science 242 : 423-426) d'un anticorps natif et par derive on entend, 
par exemple, un derive chimerique d'un tel anticorps (voir par exemple les chimeres 
des anticorps antiCD3 Souris/Homme dans Arakawa et al., 1996 J Biochem 120 : 657- 
662 ou les immunotoxines telles que sFv-toxine de Chaudary et al 1989, Nature 339 : 
394-397). Par anticorps transmembranaire on entend un anticorps dont au moins la 

10 region fonctionnelle capable de reconnaitre et de se fixer a son antigene specifique est 
exprimee a la surface des cellules cibles pour permettre lesdites reconnaissance et 
fixation. Plus particulierement, les anticorps selon la presente invention consistent en 
des polypeptides de fusion comprenant les amino acides definissant ladite region 
fonctionnelle et une sequence d 'amino acides (polypeptide transmembranaire) 

15 permettant Pancrage au sein de la double couche lipidique membranaire de la cellule 
cible ou a la surface externe de cette bi-couche. Les sequences nucleiques codant pour 
de nombreux polypeptides transmembranaires sont decrites dans la litterature. Selon un 
cas tout a fait avantageux, la sequence d'acide nucleique codant pour la chaine lourde 
de P anticorps est fusionnee avec la sequence d'acide nucleique codant pour undit 

20 polypeptide transmembranaire. 

Par elements assurant Pexpression dudit gene in vivo on fait notamment 
reference aux elements necessaires pour assurer Pexpression dudit gene apres son 
transfert dans une cellule cible. II s'agit notamment des sequences promotrices et/ou 
des sequences de regulation efficaces dans ladite cellule, et eventuellement les 

25 sequences requises pour permettre Pexpression a la surface des cellules cibles dudit 
polypeptide. Le promoteur utilise peut etre un promoteur viral, ubiquitaire ou 
specifique de tissu ou encore un promoteur synthetique. A titre d'exemple, on 
mentionnera les promoteurs tels que les promoteurs des virus RSV (Rous Sarcoma 
Virus), MPSV, SV40 (Simian Virus), CMV (Cytomegalovirus) ou du virus de la 

30 vaccine, les promoteurs du gene codant pour la creatine kinase musculaire, pour 
Pactine. II est en outre possible de choisir une sequence promotrice specifique d'un 
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type cellulaire donne, ou activable dans des conditions definies. La litterature procure 
un grand nombre d' informations relatives a de telles sequences promotrices. 

Par ailleurs, ledit acide nucleique peut comprendre au moins deux 
sequences, identiques ou differentes, presentant une activite de promoteur 
5 transcriptional et/ou au moins deux genes, identiques ou differents, situes Tun par 
rapport a F autre de maniere contigue, eloignee, dans le meme sens ou dans le sens 
inverse, pour autant que la fonction de promoteur transcriptionnel ou la transcription 
desdits genes ne soit pas affectee. 

De meme dans ce type de construction d 'acide nucleique, il est possible 
10 d'introduire des sequences nucleiques « neutres» ou introns qui ne nuisent pas a la 
transcription et sont epissees avant Fetape de traduction. De telles sequences et leurs 
utilisations sont decrites dans la litterature (reference : demande de brevet PCT WO 
94/29471). 

Ledit acide nucleique peut egalement comprendre des sequences requises 
15 pour le transport intracellulaire, pour la replication et/ou pour F integration, pour la 
transcription et/ou la traduction. De telles sequences sont bien connues de Fhomme de 
Fart. 

Par ailleurs, les acides nucleiques utilisables selon la presente invention 
peuvent egalement etre des acides nucleiques modifies de sorte qu'il ne leur est pas 

20 possible de s'integrer dans le genome de la cellule cible ou des acides nucleiques 
stabilises a l'aide d 'agents, tels que par exemple la spermine, qui en tant que tels n'ont 
pas d'effet sur l'efficacite de la transfection. 

Selon un mode de realisation de Finvention, la sequence d'acide nucleique 
est une sequence d'ADN ou ARN nue, c'est a dire libre de tout compose facilitant son 

25 introduction dans les cellules (transfert de sequence d'acide nucleique). Toutefois, 
selon un second mode de realisation de Finvention, afin de favoriser son introduction 
dans les cellules cibles et afin d'obtenir les cellules genetiquement modifiees de 
Finvention, cette sequence d'acide nucleique peut etre sous la forme d'un « vecteur », 
et plus particulierement sous la forme d'un vecteur viral, tel que par exemple un 

30 vecteur adenoviral, retroviral, un vecteur derive d'un poxvirus, notamment derive du 
virus de la vaccine ou du Modified Virus Ankara (MVA) ou d'un vecteur non viral tel 
que, par exemple, un vecteur consistant en au moins une dite sequence d'acide 
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nucleique complexee ou conjuguee a au moins une molecule ou substance porteuse 
selectionnee parmi le groupe consistant en un amphiphile cationique, notamment un 
lipide cationique, un polymere cationique ou neutre, un compose polaire pratique 
notamment choisi parmi le propylene glycol, Ie polyethylene glycol, le glycerol, 

'5 Pethanol, la l-methyl L-2-pyrrolidone ou leurs derives, et un compose polaire 
aprotique notamment choisi parmi le dimethylsulfoxide (DMSO), le diethylsulfoxide, 
le di-n-propylsulfoxide, le dimethylsulfone, le sulfolane, la dimethylformamide, le 
dimethylacetamide, la tetramethyluree, Tacetonitrile ou leurs derives. La litterature 
procure un nombre important d'exemples de tels vecteurs viraux et non viraux. 

10 De tels vecteurs peuvent en outre et de preference comprendre des 

elements de ciblage pouvant permettre de dinger le transfert de sequence d'acide 
nucleique vers certains types cellulaires ou certains tissus particuliers tels que les 
cellules cytotoxiques et les cellules presentatrices de Fantigene). lis peuvent egalement 
permettre de dinger le transfert d'une substance active vers certains compartiments 

15 • intracellulars preferes tel que le noyau, les mitochondries ou les peroxysomes, par 
exemple. II peut en outre s'agir d'elements facilitant la penetration a Finterieur de la 
cellule ou la lyse de compartiments intracellulaires. De tels elements de ciblage sont 
largement decrits dans la litterature. II peut par exemple s'agir de tout ou partie de 
lectines, de peptides, notamment le peptide JTS-1 (voir demande de brevet PCT WO 

20 94/40958), d' oligonucleotides, de lipides, d'hormones, de vitarnines, d'antigenes, 
d'anticorps, de ligands specifiques de recepteurs membranaires, de ligands susceptibles 
de reagir avec un ahti-ligand, de peptides fusogenes, de peptides de localisation 
nucleaire, ou d'une composition de tels composes. 

Utilisation de cellules transformees in vivo apres injection de vecteurs 

25 contenant au moins un gene d'interet therapeutique defini a partir des prolines 
d'interet identifies dans la presente invention (SEQ ID N° 2, 4, 8, 9, 17, 24) et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de Factivateur du ganglioside GM2, de la 

30 calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID 
N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
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d'identite et avantageusement au moins 98 % d'identite avec l'une quelconque des 
sequences peptidiques SEQ ID N° 1 a 29. 

La presente invention concerne un materiel biologique pour la preparation 
de compositions pharmaceutiques destinee a la prevention et au traitement de 
5 mammiferes atteint de maladies degenerative et/ou neurologique et/ou auto-immune, 
de preference la sclerose en plaques, la composition comprenant au moins un vecteur 
contenant un gene therapeutique comme decrit ci-dessous, capable d'etre introduit dans 
une cellule cible in vivo et d'exprimer le gene d'interet therapeutique in vivo, 
L'avantage de cette invention repose sur la possibility de maintenir sur le long terme un 
10 niveau basal de molecules exprimees dans le patient traite. Des vecteurs ou acides 
nucleiques codant pour des genes d'interet therapeutique sont injectes. Ces vecteurs et 
acides nucleiques doivent etre transports jusqu'aux cellules cibles et transfecter ces 
cellules dans lesquelles ils doivent etre exprimes in vivo. 

L'invention concerne Pexpression in vivo de sequences ,nucleotidiques 
15 et/ou de vecteurs tels que designes dans le paragraphe precedent, c'est-a-dire des 
sequences correspondant a des genes d'interet therapeutique codant notamment : 

(i) soit au moins pour une proteine choisie parmi les proteines 
identifiees dans la presente invention (SEQ ID N° 2, 4, 8, 9, 17, 24) et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une raeme famille de 
20 proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de 
liaison au retinol, du precurseur de 1'activateur du ganglioside GM2, de la 
calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID 
N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les 
sequences peptidiques qui presentent au moins 70 % d'identite de preference au 
25 moins 80 % d'identite et avantageusement au moins 98 % d'identite avec l'une 
quelconque des sequences peptidiques SEQ ID N° 1 a 29, ou leur(s) fragment(s), 

(i) soit au moins pour tout ou partie d'un anticorps polyclonal ou 
monoclonal capable de se fixer a au moins une proteine choisie parmi les proteines 
identifiees dans la presente invention (SEQ ID N° 2, 4, 8, 9, 17, 24) et les sequences 
30 peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de 
liaison au retinol, du precurseur de l'activateur du ganglioside GM2, de la 
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calgranuline B et de la saposine B (par exemple SEQ ID N°I, SEQ ID N° 3, SEQ ID 
N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les 
sequences peptidiques qui presentent au rnoins 70 % d'identite de preference au 
moins 80 % d'identite et avantageusement au moins 98 % d'identite avec Tune 
5 quelconque des sequences peptidiques SEQ ID N° 1 a 29. II peut s'agir d'anticorps 
transmembranaire natif, ou de fragment ou derive d'un tel anticorps, pour autant que 
ledit anticorps, fragment ou derive d'anticorps soit exprime a la surface de la cellule 
cible de mammifere genetiquement modifiee et en ce que ledit anticorps est capable 
de se fixer a un polypeptide present a la surface d'une cellule effectrice cytotoxique 

10 ou d'un lymphocyte T helper et implique dans le procede d'activation d'une telle 
cellule. II peut s'agir de fragments d'anticorps exprimes par des cellules capables de 
secreter lesdits anticorps dans la circulation sanguine d'un mammifere ou patient 
porteur des cellules genetiquement modifiees par le gene codant pour P anticorps, 

(ii)soit au moins pour une molecule inhibitrice d'au moins une 

15 proteine choisie parmi les proteines identifies (SEQ ID N° 2, 4, 8, 9, 17, 24) et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de Pactivateur du ganglioside GM2, 
de la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, 

20 SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et 
les sequences peptidiques qui presentent au moins 70 % d'identite de preference au 
moins 80 % d'identite et avantageusement au moins 98 % d'identite avec Tune 
quelconque des sequences peptidiques SEQ ID N° 1 a 29; proteine inhibitrice de la 
fonction et/ou du metabolisme et/ou de la fixation des proteines SEQ ID N° 2, 4, 

25 8,9, 17, 24 et les sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Pactivateur du ganglioside GM2, de la calgranuline B et de la saposine B (par 
exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID 

30 N° 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au 
moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement 
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au moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID 
N° 1 a 29, 

(Hi) soit au moins pour un ligand ou toute partie du ligand capable de 
se fixer sur au moins une proteine choisie parmi les proteines identifiees (SEQ ID 
5 N° 2, 4, 8, 9, 17, 24) et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisies parmi le perlecan, 
le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Pactivateur du ganglioside GM2, de la calgranuline B et de la saposine B (par 
exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID 
10 N° 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au 
moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement 
au moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID 
N° 1 a 29, et/ou d'inhiber sa fonction. 

Selon un mode de realisation particulier, il s'agit d'utiliser la therapie 
15 genique de maniere a dinger la reponse immune centre la proteine, le peptide ou la 
molecule d'interet cible, e'est-a-dire contre toute proteine choisie parmi les proteines 
SEQ ID N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
20 l'activateur du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple 
SEQ ID N°l, SEQ ED N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, 
SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 % 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, leur(s) 
25 fragment(s) et/ou contre toute molecule inhibitrice de la fonction et/ou de l'expression 
et/ou du metabolisme desdites proteines d'interet, et/ou des ligands desdites proteines 
comme par exemple les recepteurs. Pour cela il est evident que les cellules a cibler pour 
la transformation avec un vecteur sont des cellules appartenant au systeme immun, soit 
des cellules de type lymphocytes (CD4/CD8), soit des cellules presentatrices de 
30 1'antigene (cellules dendritiques, macrophages, ...)• 

Selon un mode de realisation particulier, on modifie genetiquement, 
notamment in vivo, les cellules presentatrices de 1'antigene (CPA). Les CPA comme les 
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macrophages, les cellules dendritiques, ies microgliocytes, les astrocytes jouent un role 
dans Tinitiation de la reponse immune. Elles sont les premiers composants cellulaires 
qui capturent l'antigene, l'apprete dans la cellule et expriment des molecules du CMHI 
et CMHII transmembranaires impliquees dans la presentation de l'immunogene aux 
5 cellules T CD4+ et CD8+, elles produisent des proteines accessoires specifiques qui 
participent a l'activation des cellules T (Debrick et al 1991, J. Immunol 147 : 2846 ; 
Reis et al., 1993, J Ep Med 178 : 509 ; Kovacsovics-bankowski et al., 1993, PNAS 90 : 
4942; Kovacsovics-bankowski et aL 1995 Science 267 : 243 ; Svensson et al., 1997, J 
Immunol 158: 4229; Norbury el al ;, 1997, Eur J Immunol 27: 280). Pour une 

10 vaccination, il peut etre avantageux de disposer d'un systeme de therapie genique qui 
peut cibler le transfert de gene dans de telles cellules APC, c'est-a-dire un gene qui 
code pour un polypeptide qui peut, apres sa production intracellulaire et son 
« processing », etre presente aux cellules CD8+ et/ou CD4+ par les molecules des 
complexes CMHI et CMHH respeciivement a la surface de ces cellules. 

15 On choisit d'exprimer a la surface des cellules CPA in vivo tout ou partie 

d'un anticorps et/ou d'un ligand comme par exemple un recepteur, capable de reagir 
avec la proteine ou le peptide cible choisis panni les proteines SEQ ID N° 2, 4, 8, 9, 17, 
24 et les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 

20 plasmatique de liaison au retinol, du precurseur de 1'activateur du ganglioside GM2, de 
la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID 
N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 % d'identite avec l'une quelconque des 

25 sequences peptidiques SEQ ID N° 1 a 29. De telles cellules vont alors specifiquement 
phagocyter ladite proteine ou ledit peptide, le «processer» de fa^on a ce que des 
fragments de ce peptide soient presentes a la surface des cellules presentatrices de 
l'antigene. 

La litterature propose un grand nombre d'exemples de genes codant pour 
30 des anticorps capables de reagir avec des polypeptides ou recepteurs. II est a la protee 
de Thomme de Tart d'obtenir les sequences d'acides nucleiques codant pour de tels 
anticorps. Citons par exemple les genes codant pour les chaines legere et lourde de 
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Tanticorps YTH 12.5 (anti-CD3) (Routiedge et al. 1991, Eur J Immunol 21 : 2717- 
2725), de !'anti-CD3 selon Arakawa et al ; 1996, J. Biochem. 120: 657-662. Les 
sequences decide nucleique de tels anticorps sont aisement identifiables a partir des 
bases de donnees comrnunemem utilisees par Phomme du metier. II est egalement 
5 possible a partir d'hybridomes disponibles aupres de TATCC de doner les sequences 
d'acides nucleiques codant pour les chaines lourdes et/ou legeres de ces differents 
anticorps par les methodes d'amplification telles que la RT-PCR a Taide 
d'oligonucleotides specifiques ou les techniques mettant en oeuvre des banques 
d'ADNc (Maniatis et al 1982, Molecular cloning. A laboratory manual CSH 

10 Laboratory, Cold Spring Harbor, New York). Les sequences ainsi clonees sont alors 
disponibles pour leur clonage dans des vecteurs. Selon un cas prefere de I'invention, la 
sequence d'acide nucleique codant pour la chaine lourde de l'anticoips est fiisionnee 
par recombinaison homologue avec la sequence d'acide nucleique codant pour un 
polypeptide transmembranaire tel que la glycoprotein rabique ou la gpl60 (Polydefkis 

15 et al., 1990, J Exp Med 171 : 875-887). Ces techniques de biologie moleculaire ont ete 
parfaitement bien decrites. 

On choisit d'exprimer a la surface des cellules CPA in vivo des fragments 
immunogenes correspondant a au nioins une proteines choisie parmi les proteines SEQ 
ID N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les fragments desdites 

20 sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple 
SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, 
SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 

25 d'identite de preference au moins SO % d'identite et avantageusement au moins 98 % 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29. Pour 
cela, on peut choisir de faire exprimer par le vecteur soit le polypeptide complet soit de 
maniere prefere des polypeptides selectionnes pour reagir avec des ligands et/ou 
recepteurs specifiques. Le peptide immunogene code par le polynucleotide introduit 

30 dans la cellule du vertebre in vivo peut etre produit et/ou secrete, apprete puis presente 
a une cellule presentatrice de I'antigene (APC) dans le contexte des molecules du 
CMH. Les APC ainsi transferees in vivo induisent une reponse immune dirigee contre 
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Fimmunogene exprime in vivo. Les APC possedent differents mecanismes pour 
capturer les antigenes : (a) la capture des antigenes par des recepteurs membranaires 
comme les recepteurs aux immunoglobulines (Fc) ou pour le complement disponibles a 
la surface des granulocytes, des monocytes ou macrophages permettant une delivrance 
5 efficace de l'antigene dans les compartiments intracellulaires apres phagocytose 
mediee par les recepteurs. (b) I'entree dans les APC par pinocytose en phase fluide, 
impliquant differents mecanismes : la micropinocytose c'est-a-dire la capture de petites 
vesicules (0.1 \xm) par les puits recouverts de clathrine et la macropinocytose c'est-a- 
dire la capture de plus grosses vesicules (avec une taille variant ente 0.5 urn et environ 

10 6 nm) (Sallusto et al. 1995, J Exp Med 182 : 389-400). Tandis que la micropinocytose 
existe de fapon constitutive dans toutes les cellules, la macropinocytose est limitee a 
des types cellulaires, comme par exemple les macrophages, les cellules dendritiques, 
les astrocytes, les cellules epitheliales stimulees par des facteurs de croissance 
(Racoosin et al., J Cell Sci 1992, 102 : 867-880). Dans cette invention, on entend par 

15 cellules capables de macropinocytose, les cellules qui peuvent realiser les evenements 
decrits ci-dessus et les cellules qui peuvent capturer des macromolecules de preference 
entre 0.5 ^m et environ 6 jim dans ie cytoplasme. 

Selon un mode de realisation particulier, on modifie genetiquement 
notamment in vivo, les cellules effectrices cytotoxiques ou ies lymphocytes T helper de 

20 fa<?on a ce qu'elles expriment a leur surface un polypeptide correspondant aux 
proteines SEQ ID N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur 
de Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B (par 

25 exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 
1 8 a 23, SEQ ID N° 25 a 29) et ies sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 % 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, a des 
ligands desdites proteines, naturellement non exprimes par ces cellules, et capables 

30 d'induire le procede deactivation de telles cellules, par Fintroduction dans ces cellules 
de sequences d'acide nucleique renfermant le gene codant pour un tel polypeptide. 
Conformement a la presente invention, il est egalement possible de selectionner une 



WO 01/05422 6I PCT/FROO/02057 



sequence d'acide nucleique contenant un gene d'interet therapeutique codant pour tout 
ou partie d'un anticorps dirige contre une proteine choisie parmi les proteines SEQ ID 
N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur 
5 de la proteine plasmatique de liaison au retinol, du precurseur de Pactivateur du 
ganglioside GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N°l, 
SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 
25 a 29) et les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 % d'identite avec 

10 Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, susceptible d'etre 
exprime a la surface des cellules cibles du patient a traiter, ledit anticorps etant capable 
de se fixer a un polypeptide naturellement non exprime par ces cellules effectrices 
cytotoxiques ou lymphocytes T helper. 

Par cellules effectrices cytotoxiques, on entend designer les macrophages, 

15 les astrocytes, les lymphocytes T cytotoxiques (TCL) et les cellules tueuses (NK) ainsi 
que leurs derives telles que par exemple les LAK (Versteeg 1992 Immunology today 
13 : 244-247 ;Brittende et al 1996, Cancer 77 :1226-1243). Par 'lymphocytes T helper 1 
on entend designer notamment les CD4 qui permettent apres activation la secretion de 
facteurs d'activation des cellules effectrices de la reponse immune. Les polypeptides et 

20 notamment les recepteurs exprimes a la surface de ces cellules et qui sont impliques 
dans P activation de telles cellules consistent notamment en tout ou partie du complexe 
TCR ou le CD3, tout ou partie des complexes CD8, CD4, CD28, LFA-1, 4- IBB 
(Melero et al., 1998, Eur J Immunol 28 : 1 1 16-1 121), CD47, CD2, CD1, CD9, CD45, 
CD30, CD40, tout ou partie des recepteurs de cytokines (Finke et al., 1998, Gene 

25 therapy 5 : 31-39), telles que IL-7, IL-4, IL-2, IL-15 ou GM-CSF, tout ou partie du 
complexe recepteur des cellules NK tel que par exemple NKAR, Nkp46, .. ; (Kawano 
et al., 1998 Immunology 95 :5690-5693 ; Pessino et al., 1998 J Exp Medl88 :953-960), 
Nkp44, tout ou partie des recepteurs de macrophages tels que par exemple le recepteur 
Fc (DeoetaL 1997, Immunology Today 18 : 127-135). 

30 De nombreux outils ont ete developpes pour introduire differents genes 

heterologues et/ou vecteurs dans des cellules, en particulier des cellules de 
mammiferes. Ces techniques peuvent etre divisees en deux categories : la premiere 
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categorie implique des technique physiques comme la micro-injection, 
I'electroporation ou le bombardement de particules. La seconde categorie est basee sur 
1'utilisation de techniques en biologie moleculaire et cellulaire avec iesquelles le gene 
est transfere avec un vecteur biologique ou synthetique qui facilite I'introduction du 
5 materiel dans la cellule in vivo. Aujourd'hui, les vecteurs les plus efficaces sont les 
vecteurs viraux en particulier les adenoviraux et retroviraux. Ces virus possedent des 
proprietes naturelles pour traverser les membranes plasmiques, eviter la degradation de 
leur materiel genetique et introduire leur genome dans le noyau de la cellule. Ces virus 
ont ete largement etudies et certains sont deja utilises experimentalement dans des 

10 applications humaines en vaccination, en immunotherapie, ou pour compenser des 
deficiences genetiques. Cependant cette approche virale a des limitations notamment 
due a la capacite de clonage restreinte dans ces genomes viraux, le risque de disseminer 
les particules virales produites dans Porganisme et Penvironnement, le risque de 
mutagenese artefactuelle par insertion dans la cellule hote dans le cas des retrovirus, et 

15 la possibility d'induire une forte reponse immune inflammatoire in vivo pendant le 
traitement, ce qui limite le nombre d'injections possibles (Mc Coy et al. 1 1995, Human 
Gene Therapy 6: 1553-1560; Yang et al., 1996 Immunity 1 : 433-422). D'autres 
systemes alternatifs a ces vecteurs viraux existent, [/utilisation de methodes non 
virales comme par exemple la co-precipitation avec le phosphate de calcium, 

20 P utilisation de recepteurs qui miment les systemes viraux (pour un resume voir Cotten 
et Wagner 1993, Current Opinion in Biotechnology, 4 : 705-710), ou Putilisation de 
polymeres comme les polyamidoamines (Haensler et Szoka 1993, Bioconjugatc Chem 
4 : 372-379). D'autres techniques non virales sont basees sur Putilisation de liposomes 
dont Tefficacite pour l'introduction de macromolecules biologiques comme FADN, 

25 TARN des proteines ou des substances pharmaceutiques actives a ete largement decrite 
dans la litterature scientifique. Dans ce domaine des equipes ont propose 1'utilisation 
de lipides cationiques ayant une forte affmite pour les membranes cellulaires et/ou les 
acides nucleiques. En fait, il a ete montre qu'une molecule d'acide nucleique elle- 
meme pouvait traverser la membrane plasmique de certaines cellules in vivo (WO 

30 90/11092), 1'efficacite etant dependante en particulier de la nature polyanionique de 
Pacide nucleique. Des 1989 (Feigner et ah, Nature 337: 387-388) les lipides 
cationiques ont ete proposes pour faciliter ['introduction de larges molecules 
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anioniques, ce qui neutralise les charges negatives de ces molecules et favorise leur 
introduction dans les cellules. DifTerentes equipes ont developpes de tels lipides 
cationiques : le DOTMA ( Feigner et al., 1987, PNAS 84 : 7413-7417), le DOGS ou 
Transfectam™ (Behr et al., 1989, PNAS 86 : 6982-6986), le DMRIE et le DORIE 
5 (Feigner et al., 1993 methods 5 : 67-75), le DC-CHOL (Gao et Huang 1991, BBRC 
179 : 280-285), le DOTAP™ (McLachlan et al., 1995, Gene therapy 2 : 674-622) ou la 
Lipofectamine™, et les autres molecules decrites dans les brevets W091 16024, 
W09514651, WO9405624. D'autres groupes ont developpes des polymeres 
cationiques qui facilitent le transfert de macromolecules en particulier des 

10 macromolecules anioniques dans les cellules. Le brevet W095/24221 decrit 
l'utilisation de polymeres dendritiques, le document WO96/02655 decrit l'utilisation 
du polyethyleneimine ou polypropyleneimine et les document US-A-5595897 et FR 
2719316, l'utilisation des conjugues polylysine. 

Etant donne que Ton souhaite obtenir in vivo une transformation ciblee 

15 vers un type cellulaire donne, il est evident que le vecteur utilise doit pouvoir etre lui- 
meme « cible », comme decrit ci dessus. 

Utilisation de cellules transformees in vitro ou ex vivo avec des vecteurs 
contenant un gene d'interet therapeutique defini par rapport aux proteines d'interet 
identifiees dans la presente invention (SEQ ID N° 2, 4, 8, 9, 17, 24) et les sequences 

20 peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison 
au retinol, du precurseur de Factivateur du ganglioside GM2, de la calgranuline B et de 
la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 
10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui 

25 presentent au moins 70 % d'identite de preference au moins 80 % d'identite et 
avantageusement au moins 98 % d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° 1 a 29. 

La presente invention concerne un materiel biologique pour la preparation 
de compositions pharmaceutiques destinee a la prevention et au traitement de maladies 

30 degenerative et/ou neurologique et/ou auto-immune, de preference la sclerose en 
plaques, la composition comprenant au moins une cellule, notamment une cellule ne 
produisant pas naturellement des anticorps, sous une forme permettant leur 
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administration dans l'organisme d'un mammifere, humain ou animal, ainsi 
qu'eventuellement leur culture prealable, ladite cellule etant genetiquement modifiee in 
vitro par au moins une sequence d'acide nucleique contenant au moins un gene codant 
in vivo pour : 

(i) au moins une proteine choisie parmi les proteines SEQ ID N° 2, 4, 
8, 9, 17, 24, et les sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
I'activateur du ganglioside GM2, de la calgranuline B et de la saposine B (par 
exemple SEQ ID N°l, SEQ ID N c 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID 
N° 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au 
moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement 
au moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID 
N° 1 a 29 et les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 % d'identite 
avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, et tout 
fragment 

(ii) au moins un peptide defini a partir de la sequence primaire d'au 
moins une proteine choisie parmi les proteines SEQ ID N° 2, 4. 8, 9, 17, 24, et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de l'activateur du ganglioside GM2, 
de la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, 
SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et 
les sequences peptidiques qui presentent au moins 70 % d'identite de preference au 
moins 80 % d'identite et avantageusement au moins 98 % d'identite avec l'une 
quelconque des sequences peptidiques SEQ ID N c 1 a 29, 

(iii) au moins toute molecule inhibitrice de la fonction et/ou de la 
fixation et/ou de 1'expression de ces proteines, 

(iv) au moins un peptide issu de la sequence primaire d'une proteine 
choisie parmi les proteines SEQ ID N° 2, 4, 8, 9, 17, 24 r et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
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proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de 
liaison au retinol, du precurseur de Pactivateur du ganglioside GM2, de la 
calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID 
N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les 
sequences peptidiques qui presentent au moins 70 % d'identite de preference au 
moins 80 % d'identite et avantageusement au moins 98 % d'identite avec Tune 
quelconque des sequences peptidiques SEQ ID N° 1 a 29, et capable de se fixer sur 
au moins une glycoproteine du CMHI, 

(v) au moins tout anticorps et toute partie d'anticorps capables de se 
fixer a au moins une proteine choisie parmi les proteines SEQ ID N° 2, 4, 8, 9, 17, 
24, et les sequences peptidiques ou les fragments desdites sequences appartenant a 
une meme famille de proteines choisies parmi le perlecan, le precurseur de la 
proteine plasmatique de liaison au retinol, du precurseur de 1'activateur du 
ganglioside GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID 
N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 1 8 a 23, SEQ 
ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % d'identite 
de preference au moins 80 % d'identite et avantageusement au moins 98 % 
d'identite avec l'une quelconque des sequences peptidiques SEQ ID N° 1 a 29. 

Plus particulierement, ladite cellule cible provient soit du mammifere a 
traiter, soit d'un autre mammifere que celui a traiter. Dans ce dernier cas, il convient de 
noter que ladite cellule cible aura subi un traitement la rendant compatible avec le 
mammifere a traiter. Par « mammifere » on entend, de preference, un mammifere 
humain. Ces cellules sont etablies en lignees cellulaires et sont preferentiellement 
CMHII+ ou CMHII+-inductibles comme les lymphocytes, les monocytes, les 
astrocytes, les oligodendrocytes. 

L'invention concerne egalement les cellules modifiees et un procede de 
preparation d'une cellule telle que decrite ci dessus caracterise en ce que 1'on introduit 
dans une cellule de mammifere ne produisant pas naturellement d'anticorps, par tout 
moyen approprie, au moins une sequence d'acide nucleique contenant au moins un 
gene d'interet therapeutique et des elements assurant 1'expression dudit gene dans 
ladite cellule, ledit gene d'interet therapeutique contenant une sequence d'acide 
nucleique codant pour une molecule ou un fragment de molecule in vivo, comme decrit 
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juste ci-dessus. Plus particulierement, elle concerne des cellules procaryotes , des 
cellules de levure et des cellules animates, en particulier des cellules de mammiferes 
transformees par au moins une sequence nucleotidique et/ou un vecteur tel que decrit 
precedemment. 

Selon un mode de realisation particulier, les cellules (cellules 
dendritiques, macrophages, astrocytes, lymphocytes T CD4+, lymphocytes T CD8+, 

) du patient ou allogeniques sont placees en contact d'une preparation purifiee du 

polypeptide cible, celui-ci etant internalise, apprete et presente a la surface cellulaire 
associe aux molecules du CMHI et/ou CMHII et ainsi induire une reponse immune 
specifique contre le peptide. Les cellules « activees » sont ensuite administrees au 
patient chez lequel elles vont induire une reponse immune specifique des antigenes (on 
utilise une voie naturelle de la reponse immune, mais on controle ce que la cellule 
presentatrice de Tantigene va presenter) 

Selon un mode de realisation particulier, les cellules presentatrices 
d'antigene (cellule dendritique, macrophage, astrocytes,..) sont modifiees in vitro pour 
exprimer les antigenes dans la cellule transformee qui vont s'associer aux molecules du 
CMHI et/ou CMHII et etre presentees a la surface des cellules pour induire chez le 
patient chez lequel on administre la cellule modifiee une reaction immune parfaitement 
ciblee. 

Toutes les approches vaccinales ne sont pas toujours satisfaisantes et 
conduisent par exemple a des reactions immunes limitees dirigees uniquement a 
Tencontre d'epitopes immunodominants ou contre des antigenes presentant une grande 
variabilite. De meme la presentation incorrecte des antigenes par les glycoproteines du 
systeme CMH a la surface des cellules, ne permet pas de developper chez le patient 
traite une immunite anti-proteine d'interet convenable. Afin de pallier ces problemes, 
certains auteurs ont propose dans le cadre de tels procedes vaccinaux, de selectionner 
les fragments minimaux antigeniques correspondant aux portions de peptide 
susceptibles d'etre reconnus specifiquement par les lymphocytes T cytotoxiques, de les 
exprimer dans les cellules afin qu'ils s'associent aux molecules du CMHI et soient 
presentes a la surface des cellules pour induire chez le patient traite une reaction 
immunitaire parfaitement ciblee (Toes et al. 1997, PNAS 94: 14660-14665). Plus 
particulierement, il a ete montre que des epitopes de tres petites tailles (variant de 7 a 
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environ 13 acides amines) qui sont exprimes a partir de minigenes introduits dans un 
virus de la vaccine, pouvaient induire une immunisation de type cellulaire. II a par 
ailleurs ete montre que plusieurs minigenes pouvaient etre exprimes conjointement a 
partir d'un meme vecteur (cette construction particuliere est appelee « string of 
5 beads »). Une telle construction presente 1'avantage d'induire une reaction immune de 
type CTL synergique (Whitton et al ;, 1993 J. of Virology 67 : 348-352). 

Protocole de mise en contact des cellules et du fragment antigenique : 
La presentation des fragments antigeniques par les molecules CMHI 
repose sur un procede intracellular identifie (voir Groettrup et al., 1996 Immunology 

10 Today 17 : 429-435 pour une revue) au cours duquel des peptides antigeniques de tres 
courtes tailles (environ 7-13 acides amines) sont produits par degradation d'un 
polypeptide plus complexe contre lequel la reaction immune finale sera dirigee. Ces 
courts peptides sont ensuitc associes aux molecules du CMHI ou du CMHII pour 
former un complexe proteique qui est transports a la surface cellulaire afin de presenter 

15 lesdits peptides aux lymphocytes T cytotoxiques circulants ou aux lymphocytes T 
helper circulants, respectivement. II convient en outre de noter que la specificite des 
molecules CMH I ou CMH II vis-a-vis des peptides antigeniques varie en fonction des 
molecules CMH I ou CMH II (exemple pour le CMHI : HLA-A, HLA-B, ...) et de 
Pallele (exemple pour le CMH I : HLA-A2, HLA-A3, HLA-A11) consideres. Au sein 

20 d'une meme espece animale, d'un individu a l'autre, il existe une grande variabilis des 
genes codant pour les molecules du systeme CMH (a ce sujet, voir notamment George 
et al., 1995, Immunology Today 16 : 209-212). 

Selon un mode de realisation particulier, les cellules, telles que les cellules 
dendritiques, les macrophages, les astrocytes, les lymphocytes T CD4+, les 

25 lymphocytes T CD8+, sont modifiees de maniere a exprimer a leur surface des 
anticorps specifiques du peptide cible. Le peptide est neutralise par les anticorps 
exprimes a la surface des cellules. Ces cellules sont de preference immunes, de 
preference du patient, de preference cytotoxiques, modifiees pour exprimer tout ou 
partie d'un anticorps specifique du polypeptide cible. 

30 Isolement de cellules mononucleees a partir de sang peripherique : 

En 1968, Boyum decrivit une technique rapide qui permet par 
centrifugation du sang sur gradient de densite, de separer les cellules mononucleees 
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(lymphocytes et monocytes) avec un bon rendement (rendement theorique 50 %, c'est- 
a-dire 10 6 cellules /ml de sang). 50 ml de sang peripherique preleves sterilement dans 
des tubes heparines sont centrifuges 20 minutes a 150g a 20°C. Les cellules recuperees 
sont diluees dans deux volumes de sang peripherique initial de PBS sterile. 10 ml de 
5 cette suspension sont deposes sur 3ml d'une solution de Ficoll-Hypaque (milieu de 
separation des lymphocytes, Flow). Apres centrifugation pendant 20 minutes a 400g et 
20°C sans freinage de deceleration , les cellules mononucleees sedimentent a 
I' interface PBS-Ficoll, en une couche dense, opalescente, alors que la quasi-totalite des 
globules rouges et des polynucleaires sedimentent au fond du tube. Les cellules 

10 mononucleees sont recuperees et lavees en PBS sterile. 

Internalisation des antigenes par les cellules presentatrices de l'antigene : 
Traitement prealable des cellules presentatrices de l'antigene : les cellules 
presentatrices de l'antigene sont prealablement lavees avec un tampon PBS-BSA a 
0.5% (p/v) puis enumerees puis elle sont preincubees en presence de differents 

15 inhibiteurs de reduction trois fois en PBS-BSA 0.5% contenant de 10 uM a 10 mM 
final de DTNB (acide 5,5'-dithio-bis-2-nitrobenzoique) ou de NEM (N- 
ethylmaleimide). Les etapes ulterieures de fixation d'antigenes a la surface cellulaire 
ou d 'internalisation d'antigenes se realisent aussi en presence des differentes 
concentrations d'inhibiteurs. 

20 Protocole d' internalisation des antigenes par les cellules presentatrices de 

l'antigene : 

8. 10'* cellules sont internalisees en presence de quantite saturante de 
proteines radiomarquees a l'iode 125 (1 ug) dans des micropuits dans 70 ul. Apres une 
heure d'incubation a 4°C sous agitation, les antigenes sont fixes a la surface des 

25 cellules. La suspension cellulaire est lavee deux fois en PBS-BSA et les culots 
cellulaires sont repris dans 70 ul de tampon et incubees a 37°C pendant differentes 
periodes allant jusqu'a 2 heures. Cellules et surnageants sont separes par centrifugation 
a 800g pendant 5 minutes 4°C. Pour des plus longues periodes d'incubation, Petape 
preliminaire de prefixation des antigenes a la surface des cellules est supprimee. Les 

30 cellules sont diluees dans un milieu RPMI-10% SVF en presence de 20 mM Hepes, a 
10 (> celiules /ml. Les cellules sont incubees en presence d'un exces d'antigene pendant 
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differentes periodes a 37°C (1 ug de molecules /5.10 7 cellules 
monocytes/macrophages ou /10 s cellules B-EBV). 

Tous les agents therapeutiques definis dans le cadre de la presente 
invention sont utilises pour prevenir et/ou traiter une maladie degenerative et/ou 
neurologique et/ou auto-immune, telle que la sclerose en plaques, seuls ou en 
combinaison. lis peuvent etre utilises egalement pour evaluer leur efficacite in vitro ou 
in vivo. 

Administration chez Phomme des agents therapeutiques: 
Le materiel biologique selon F invention peut etre administre in vivo 
notamment sous forme injectable. On peut egalement envisager une injection par voie 
epidermique, intraveineuse, intra-arterielle, intramusculaire, intracerebrale par seringue 
ou tout autre moyen equivalent. Selon un autre mode de realisation par administration 
orale ou tout autre moyen parfaitement connu de Thomme de Tart et applicable a la 
presente invention. L'administration peut avoir lieu en dose unique ou repetee, une ou 
plusieurs fois apres un certain delai d'intervalle. La voie d'administration et le dosage 
les mieux appropries varient en fonction de differents parametres tels que par exemple 
Tindividu ou la maladie a traiter, du stade et/ou de revolution de la maladie, ou encore 
de Facide nucleique et/ou de la proteine et/ou peptide et/ou molecule et/ou cellule a 
transferer ou de l'organe/tissus cible. 

Pour la mise en oeuvre du traitement du mammifere mentionne dans la 
presente invention, il est possible de disposer de compositions pharmaceutiques 
comprenant un materiel biologique tel que precedemment decrit, avantageusement 
associe avec un vehicule pharmaceutiquement acceptable pour T administration a 
Phomme ou a Tanimal. L'utilisation de tels supports est decrite dans la litterature (voir 
par exemple Remington's Pharmaceutical Sciences 16 th ed. 1980, Mack Publishing 
Co). Ce vehicule pharmaceutiquement acceptable est preferentiellement isotonique, 
hypotonique ou presente une faible hypertonicite et a une force ionique relativement 
basse, tel que par exemple une solution de sucrose. Par ailleurs, ladite composition peut 
contenir des solvants, des vehicules aqueux ou partiellement aqueux tels que de l'eau 
sterile, libre d'agents pyrogene et des milieux de dispersion par exemple. Le pH de ces 
compositions pharmaceutiques est convenablement ajuste et tamponne selon les 
techniques conventionnelles. 
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Figures : 

La figure 1 represente la sequence en amino acides de la proteine 
GM2AP, et la localisation des peptides, qui est soulignee, et qui sont utilises pour la 
5 production des anticorps anti-peptides GM2AP. 

La figure 2 represente la sequence en amino acides de la proteine MRP 14, 
ct la localisation des peptides, qui est soulignee, et qui sont utilises pour la production 
des anticorps anti-peptides MRP14. 

La figure 3 represente la sequence en amino acides de la proteine Saposine 
10 B, et la localisation des peptides, qui est soulignee, et qui sont utilises pour la 
production des anticorps anti-peptides Saposine B. 

La figure 4 represente le dosage de la proteine MRP8 (ng/ml - en 
ordonnee) dans les urines de patients atteints de sclerose en plaques (SEP), dans les 
urines de patients atteints d'autres maladies neurologiques (AMN) et dans les urines de 
15 temoins consideres sains (TS). n signifie le nombre d'urines testees par categorie. 

La figure 5 represente le dosage de la proteine MRP14 (ng/ml - en 
ordonnee) dans les urines de patients atteints de sclerose en plaques (SEP), dans les 
urines de patients atteints d'autres maladies neurologiques (AMN) et dans les urines de 
temoins consideres sains (TS). n signifie le nombre d'urines testees par categorie. 
20 La figure 6 represente le dosage de la proteine MRP8/14 (ng/ml - en 

ordonnee) dans les urines de patients atteints de sclerose en plaques (SEP), dans les 
urines de patients atteints d'autres maladies neurologiques (AMN) et dans les urines de 
temoins consideres sains (TS). n signifie le nombre d'urines testees par categorie. 

La figure 7 represente les concentrations moyennes des proteines MRP8, 
25 MRP14, MRP8/14 (ng/ml - en ordonnee) dans les urines de patients atteints de sclerose 
en plaques (SEP), dans les urines de patients atteints d'autres maladies neurologiques 
(AMN) et dans les urines de temoins consideres sains (TS). n signifie le nombre 
d'urines testees par categorie. 

La figure 8 represente le dosage de la proteine GM2AP (ng/ml - en 
30 ordonnee) dans les urines de patients atteints de sclerose en plaques (SEP), dans les 
urines de patients atteints d'autres maladies neurologiques (AMN) et dans les urines de 
temoins consideres sains (TS). n signifie le nombre d'urines testees par categorie. MS 
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signifie SEP, OND signifie AMN et Healthy signifie prelevements de temoins 
supposes sains (TS). 

La figure 9 represente le dosage de la proteine Saposine B (jig/ml - en 
ordonnee) dans les urines de patients atteints de sclerose en plaques (SEP), dans les 
5 urines de patients atteints d'autres maladies neurologiques (AMN) et dans les urines de 
temoins consideres sains (TS). n signifie le nombre d' urines testees par categoric MS 
signifie SEP, OND signifie AMN et Healthy signifie prelevements de temoins 
supposes sains (TS). 

La figure 10 represente la co-detection des proteines Saposine B (ng/ml - 
10 en ordonnee) et GM2AP (ng/ml - en abscisse) dans des echantillons d'urine de patients 
SEP, de temoins supposes sains et de patients atteints d'autres maladies neurologiques 
et la correlation observee entre les taux des deux proteines. 

La figure 1 1 represente : figure 1 1 A, le dosage de la proteine GM2AP en 
ng/ml dans les urines d'un patient SEP en forme remittente progressive (courbe claire) 
15 et la gliotoxicite en pourcentage de cellules mortes estimees par le test MTT (courbe 
foncee) ; figure 1 IB le dosage de la proteine Saposine B en jig/ml dans les urines d'un 
patient SEP en forme remittente progressive (courbe claire) et la gliotoxicite en 
pourcentage de cellules mortes estimees par le test MTT (courbe foncee). 

La figure 12 represente le produit des concentrations des proteines 
20 GM2AP et saposine B en ngx^g/ml 2 dans les urines d'un patient SEP en forme 
remittente progressive (courbe claire) et la gliotoxicite en pourcentage de cellules 
mortes estimees par le test MTT (courbe foncee). 

La figure 13 : figure 13 A, le dosage de la proteine GM2AP en ng/ml dans 
les urines d'un patient SEP en forme progressive (courbe claire) et la gliotoxicite en 
25 pourcentage de cellules mortes estimees par le test MTT (courbe foncee) ; figure 13B 
le dosage de la proteine Saposine B en \ig/m\ dans les urines d'un patient SEP en forme 
progressive (courbe claire) et la gliotoxicite en pourcentage de cellules mortes estimees 
par le test MTT (courbe foncee). 

La figure 14 represente le produit des concentrations des proteines 
30 GM2AP et saposine B en ngx^g/ml 2 dans ies urines d'un patient SEP en forme 
progressive (courbe claire) et la gliotoxicite en pourcentage de cellules mortes estimees 
par le test MTT (courbe foncee). 
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La figure 15 represente la correlation entre les concentrations de GM2AP 
en ng/ml (abscisse) et de gliotoxicite en pourcentage de cellules mortes estimees par le 
test MTT (ordonnee) determinees dans des urines de patients SEP et de temoins. 

La figure 16 represente la correlation entre les concentrations de Saposine 
5 B en ng/ml (abscisse) et de gliotoxicite en pourcentage de cellules mortes estimees par 
le test MTT (ordonnee) determinees dans des urines de patients SEP et de temoins. 

La figure 17 represente la correlation entre le produit des concentrations 
de GM2AP et Saposine B en ngx^g/ml 2 (abscisse) et de gliotoxicite en pourcentage de 
cellules mortes estimees par le test MTT (ordonnee) determinees dans des urines de 
10 patients SEP et de temoins. 

La figure 18 represente la correlation entre les concentrations en GM2AP 
(ng/ml - en ordonnee gauche), les concentrations en Saposine B (ug/ml - ordonnee 
droite) et la gliotoxicite en pourcentage de cellules mortes estimees par le test MTT 
(abscisse). Deux droites de correlation estimees sont representees sur le graphe. Les 
15 lignes en gras sont relatives aux concentrations en saposine B ; les lignes en noir clair 
sont relatives aux concentrations en GM2AP. 

Exemples : 

Exemple I : Recueil et pool d'urines. 

Des echantillons d 'urine de volumes differents ont ete preleves a partir 
d'individus sains (SEP negatifs) n'ayant a priori aucune maladie neurologique ou auto- 
immune. L'activite toxique de chaque prelevement vis a vis de cellules astrocytaires 
murines a ete testee in vitro en utilisant le test MTT. Au total un pool de 20 litres 
d'urine a ete constitue (pool SEP negatif). Parallelement, des echantillons d'urine de 
volumes differents ont ete preleves a partir d'individus atteints de sclerose en plaques 
(SEP positifs) a differents stade de la maladie. L'activite toxique de chaque 
prelevement vis a vis de cellules astrocytaires murines a ete testee in vitro en utilisant 
le test MTT. Au total un pool de 80 litres d'urine a ete constitue (pool SEP positif). 

Exemple 2 : Purification des proteines urinaires. 



25 
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Les pools d'urine SEP positif et SEP negatif, recueillis et testes selon 
I'exemple 1, ont ete purifies pour obtenir une concentration en proteines elevee et 
eliminer au maximum les proteines de haut poids moleculaire. 

Precipitation : des precipitations au sulfate d'ammonium (Prolabo - ref. 21 
5 333 365) ont ete effectuees sur les pools d'urine SEP positif et SEP negatif. Le 
pourcentage de 60 % de sulfate d'ammonium sature pour 40 % d'urine, soit 390 
grammes de sulfate d'ammonium par litre d'urine a ete utilise. Chaque pool est reparti 
en fractions de 1,8 litres dans des flacons de 2 litres pour ameliorer la precipitation. La 
precipitation a ete effectuee durant 2x8 heures, a temperature ambiante, sous agitation 

10 douce. Apres centrifugation des pools d'urine a 3 000 tpm pendant 10 min., a une 
temperature de 10°C, le culot obtenu est repris dans un tampon Tris 20 mM contenant 
du CaCL 1 mM et de Puree a 0,25 M. Le melange a ensuite ete centrifuge a 3 000 tpm 
pendant 10 min. Le surnageant contient les proteines concentrees. II est soit utilise 
immediatement pour 1'etape suivante, soit congele si l'etape suivante ne peut etre 

15 effectuee en continu. 

Chromatographic par echange d'ions : la solution contenant les proteines a 
ensuite ete passee sur un gel DEAE fast Flow (commercialise par PHARMACIA). 
Cette etape est effectuee a basse pression sur une colonne PHARMACIA remplie de 
gel. Les tampons sont amenes sur la colonne par une pompe peristaltique qui permet un 

20 debit regulier. Le tampon d'equilibration de la colonne est le tampon Tris 20 mM, pH 
7. La fraction correspondant au surnageant de precipitation et contenant une quantite de 
sels trop elevee est dialysee contre ce tampon avant depot sur la colonne. Une elution 
par un gradient salin permet de recuperer les proteines. Le gradient d'elution est 
effectue par palier de NaCl 100, 200, 300, 500 mM dans le tampon d'equilibration de 

25 la colonne. Les fractions d'elution sont testees par le test MTT et ne seront conservees 
que les fractions positives, soit la fraction eluee a 200 Mm NaCl. Ces fractions 
pourront etre traitees immediatement ou conservees a Tetat lyophilise. 

Purification : Une chromatographie d'exclusion sterique basee sur la 
difference de taille et de forme des proteines a eluer a ete utilisee. La fraction 

30 correspondant a 1'elution 200 mM NaCl est deposee sur la colonne. Au cours de 
1'elution, les proteines de faible masse moleculaire sont retenues et done eluees plus 
tardivement que les grosses molecules. Les purifications ont ete effectuees sur HPLC 
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avec une colonne TosoHaas TSK Prep G 3000 SW, d'un diametre de 21,5 mm et d'une 
longueur de 300 mm, la limite d'exciusion en masse moleculaire est de 500 000 
daltons. Le tampon dilution utilise contient du phosphate 100 mM, du sulfate de 
sodium 100 mM, a pH 6,8. La separation du melange de proteines a ete effectue en 60 

5 min. Seule la fraction correspondant a une masse de 15-20 000 daltons a ete conserves 
Cette fraction est dialysee dans un tampon Tris 20 mM contenant du CaCL 0,2 mM, pH 
7,2, puis lyophilisee. 

A chaque etape, seules les fractions presentant une activite toxique 
significative ont ete retenues pour Tetape suivante. Un controle de 1'activite toxique 

10 des proteines a ete effectue a chaque etape, a l'aide du test MTT. Seules les fractions 
presentant une activite toxique significative ont ete retenues pour Tetape de 
purification supplementaire decrite dans l'exemple 3. 

Exemple 3 : Purification supplementaire des proteines urinaires par 

1 5 chromatographic phase inverse. 

Des pools d'urine provenant de patients SEP (pool SEP positif) et de 
patients non SEP (pool SEP negatif), obtenus apres purification selon l'exemple 2, ont 
ete repris dans de l'eau distillee, puis dilues avec une solution 0,2% TF A/10% 
acetonitrile pour obtenir une concentration finale d'environ 130 a 140 [ig/ml. 

20 La separation par HPLC phase inverse C8 a ete effectuee sur une colonne 

Brownlee Aquapore (nom commercial) commercialisee par la societe Perkin Elmer 
(caracteristiques de la colonne : 300 angstroms/7 \im/( 100x4,6) mm). Deux colonnes 
distinctes ont ete utilisees respectivement pour les pools positif et negatif Les 
injections ont ete realisees par multi-injections de 250 [il Les proteines ont ete eluees 

25 avec un gradient lineaire de 5% a 15% de tampon B en 5 min., puis de 15% a 100% de 
tampon B en 95 min., a un debit de 0,5 ml/min. Les tampons de separation A et B 
utilises sont respectivement le tampon 0,1% TFA (Pierce n° 28904)/ eau MilliQ et le 
tampon 0,09% TF A/80% acetonitrile (Baker). La detection a ete effectuee par mesure 
de l'absorbance UV a 205 et 280 nm. La collecte des fractions a ete effectuee en 

30 fractions de 1,5 ml et de 0,5-1 ml dans la zone d'interet. Les fractions ont ete congelees 
apres la collecte dans de la carboglace. 
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Les fractions collectees ont ensuite ete sechees en speed vac et reprises 
dans 100 \il de 0,1% TF A/30% acetonitrile. 20^I des fractions ont ete transferes dans 
des eppendorfs de 500 seches et laves a deux reprises avec 100 ^1 d'eau MilliQ, 
puis seches de nouveau. 
5 L'activite toxique des proteines contenues dans chaque fraction recueillie 

apres elution a ete determinee a Taide du test MTT. Seule la fraction 21 presentant une 
activite toxique significative a ete retenue. Le numero de cette fraction correspond a 
Tordre de Pelution en fonction des conditions d'elution enoncee dans cet exemple. 

10 Exemple 4: Analyse des proteines obtenues par separation sur HPLC sur 

gel SDS-TRICINE. 

Le pool de collecte de la fraction 21 obtenue par HPLC, comme decrit 
dans l'exempie 3, et provenant de 20 injections du pool SEP positif, a ete depose sur un 
gel SDS-TRICINE 16% precoule de 10 puits et de 1 mm d'epaisseur (commercialise 

15 par la societe Novex). Les conditions d'utilisation du gel correspondent a celles 
preconisees par le fournisseur. L'echantillon est repris dans 75 jal du tampon 
d'echantillon 1 fois concentre (SDS-TRICINE N° LC 1676, 1 ml deux fois concentre + 
50|il de P-mercaptoethanol (Pierce) dilue au 1/2 dans de l'eau) et 25^il de I'echantillon 
sont deposes sur le gel en trois fois. Le pool de collecte de la fraction 21 provenant de 6 

20 injections du pool SEP negatif a ete depose sur le gel dans les memes conditions que 
celles decrites pour le pool SEP positif. La migration sur les deux gels a ete effectuee 
en parallele dans la meme cuve de migration (XCELL II NOVEX (nom commercial)) a 
un voltage constant de 125 mV pendant 2 heures. La cuve est placee dans un bac 
contenant de la glace. Les gels ont ete colores directement apres la migration par 

25 coloration au zinc/imidazole (kit de coloration 161-0440 commercialise par la societe 
BIORAD) pour obtenir une coloration negative reversible. Les bandes de proteines 
sont transiucides sur fond opaque. 



30 



Exemple 5 : Digestion a la trypsine des bandes de gel. 
Toutes les bandes de proteines visualisees dans les depots de la fraction 21 
ont ete decoupees et soumises a une proteolyse par la trypsine. 
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Les bandes de gels sont decoupees au scalpel en tranches de 1 mm et 
transferees dans des tubes eppendorfs. Les eppendorfs sont soumis a un pic de 
centrifugation pour faire tomber les morceaux de gel et apres centrifugation 100 \i\ de 
tampon de lavage (100 Mm NH 4 CO 3 /50% CH 3 CN) sont ajoutes aux morceaux de gel. 
Apres 30 min. d'agitation a temperature ambiante, le surnageant est enleve par 
fractions de 20 fil et Tetape de lavage est renouvelee deux fois. Les eppendorfs sont 
seches pendant 5 min. en speed vac. 20 ^g de trypsine (Modified sequenal grade 
PROMEGA V51 1 1) sont repris dans 200 \il de tampon de digestion (5 mM TRIS, pH 
8) et sont dissous pendant 30 min. a temperature ambiante, sous agitation intermittente 
et 20 a 30 ^1 de trypsine resuspendue sont ajoutes aux morceaux de gel. Les eppendorfs 
sont centrifuges et conserves en chambre chaude a 28°C pendant une nuit. Apres 
digestion les bandes de gel peuvent etre utilisees immediatement pour les mesures de 
masse ou congelees pour usage ulterieur. 

Exemple 6 : Digestion chimique au CNBR des bandes de gel. 

Dans l'eventualite d'une proteine resistante aux clivages enzymatiques, en 
particulier a Faction de la trypsine comme decrit dans 1'exemple 5, les bandes entre 
16kD et 20kD ont ete traitees avec du CNBR. Les bandes de gel, deja utilisees pour les 
digestions avec la trypsine, sont sechees 5 a 10 min. en speed vac. 
Une solution de CNBR (FLUKA) a 200 mg/ml a ete preparee dans 70 % acide 
formique (BAKER). 20 ^1 de cette solution ont ete utilisees pour rehydrater les 
morceaux de gel. La reaction s'est faite pendant 20 h a temperature ambiante et a 
Pobscurite. Les peptides sont extraits 3 fois 30 min. avec 100 ^1 de 0.1 % TFA / 60% 
Acetonitrile. Les solutions d'extraction sont reunies et concentrees a 20 ul. Ces 
echantilions sont dilues 5 fois dans 0,1 % TFA/eau. Les conditions de separation sont 
celles decrites pour les peptides de la digestion avec la trypsine. 

Exemple 7 : Analyse par spectrometrie MALDI-TOF. 

30 ul de tampon d'extraction (2 % TFA/50 % acetronitrile) sont ajoutes 
aux echantilions. Les eppendorfs a analyser sont soumis a une centrifugation de 5 min., 
puis a une sonication de 5 min. et flnalement a une centrifugation de 1 min. 
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Sur un disque en acier inoxydable, 14 depots de 0,5 ul de matrice (acide a-cyano-4- 
hydroxy-trans-cinnamique a saturation dans de F acetone) sont realises. Une fine 
couche microcristalline uniforme est obtenue. 0,5 \x\ d'une solution de 2 % TFA/eau 
sont deposes sur cette sous-couche sur les 14 depots, puis 0,5 ^1 d'echantillon a 
5 analyser sont ajoutes. Dans cette goutte ainsi formee, 0,5 ul d'une solution a saturation 
d' acide d' acide ot-cyano-4-hydroxy-trans-cinnamique dans 50 % acetonitrile/eau sont 
ajoutes. Apres un scchage a temperature ambiante pendant 30 min., les depots 
cristallins sont laves avec 2 u.1 d'eau qui sont immediatement evacues par un souffle 
d'air. Tous les spectres sont obtenus sur un spectrometre de masse BRUKER BIFLEX 

10 (marque de commerce) equipe d'un reflectron. Les mesures (90 a 120 tirs laser sur 
Tensemble du depot) sont accumulees pour obtenir un spectre de masse qui soit le plus 
representatif de P ensemble des peptides presents dans le sandwich matrice-echantillon. 
Pour chaque depot, une calibration avec les peptides de Tautolyse de la trypsine a ete 
faite afin de pouvoir utiliser une precision de mesure inferieure a 100 ppm. 

15 Les recherches dans les banques de donnees ont ete executees dans MS-FIT 
PROTEINPROSPECTOR (http://prospector.ucsf.edu). Les parametres communs, 
utilises dans ces recherches, sont (1) base de donnees : NCBInr, (2) une tolerance de 
100-50 ppm, (3) les cysteines ne sont pas modifiees, (4) les methionines peuvent etre 
oxydees, (5) gamme de poids moleculaire : 1000-100000 Da, (6) jusqu'a 3 sites de 

20 coupure peuvent etre ignores. 

Exemple 8 : Sequenpage N-terminal des peptides de digestion, 
(i) Extraction et separation par HPLC des peptides de digestion. 
Apres les mesures de masse sur la totalite de la digestion, le reste des peptides est 

25 extrait en 3 fois 30 min. dans un bain de sonication avec 0,1 % TFA/60 % acetonitrile. 
Les solutions d'extraction sont reunies et sechees jusqu'a 20 ul en speed vac. Apres 
dilution dans 80 ul de tampon A (0,1 % TFA/eau), les extractions des bandes de gel, 
digerees avec de la trypsine, sont injectees sur une colonne C18/MZ- 
Vydac/(l25xl,6)mm/5 urn. L'elution des peptides se fait a un debit de 150 ul/min. et 

30 dans un gradient ailant de 5 % de tampon B (0,09 % TFA/80 % acetronitrile) a 40 % de 
tampon B en 40 min., puis de 40 % de tampon B a 100 % de tampon B en 10 min. La 
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detection est faite par mesure de Tabsorbance UV a 205 nm. La collecte des pics est 
effectuee dans des tubes eppendorf de 500 Les fractions sont conservees sur la glace 
et pour la bande de 18-20 kD du pool 21 SEP positif analysees par spectrometrie de 
masse MALDI-TOF. 
5 (ii) Sequen?age N-terminal. 

Les fractions ne correspondant qu'a un seul pic de masse ont ete analysees 
par degradation d'Edman sur un sequenceur (Modele 477A PERKIN ELMER/ Applied 
Biosystems). Les conditions de sequen9age sont celles decrites par le constructeur. Une 
micro cartouche a ete utilisee pour le depot des echantillons et les PTH-AminoAcid 
10 sont identifies avec un systeme HPLC online (Modele 120A PERKIN ELMER/ Applied 
Biosystems). 

Le depot de la fraction a sequencer s'est fait en plusieurs depots de 15 nl 
avec des sechages intermediaries. Le tube ayant contenu le peptide est lave avec 1 5 ^1 
d'acide formique 85 % (BAKER). Les sequences d'acides amines correspondent 
15 toujours aux masses mesurees. Les peptides, dont les masses ne correspondent pas a la 
proteine principale identifiee, ont ete sequences en priorite. De cette maniere, il a ete 
possible d ' identifier jusqu'a trois proteines dans une bande de gel 

Exempie 9 : Resultats et discussion. 

20 Apres HPLC inverse du pool temoin SEP negatif et du pool SEP positif, 

f activite toxique de chaque fraction d'elution a ete determinee en utilisant le test MTT. 
Seule la fraction 21 du pool SEP positif presente une activite toxique in vitro. La 
fraction 21 du pool temoin SEP negatif ne presente aucune activite toxique. L'activite 
toxique de la fraction 21 du pool SEP positif a ete confirmee in vitro par FACS, comme 

25 decrit dans la demande de brevet WO 98/1 1439 sur des cellules astrocytaires murines. 

Le contenu proteique de la fraction 21 du pool temoin SEP negatif et du 
pool SEP positif a ete observe apres separation sur gel SDS-TRICINE 16% et 
coloration du gel au zinc/imidazole. Des proteines de poids moleculaires apparents 
eleves ont ete trouvees dans les deux fractions. Par contre cinq bandes differentes et de 

30 poids moleculaires apparents faibles ne sont visibles que dans la fraction 21 du pool 
SEP positif (bandes 8, 14, 18 et 20 kD). A chaque bande correspond au moins une 
proteine et des variants desdites proteines qui ont un poids moleculaire apparent proche 
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de celui de la proteine native. Ces sequences variantes presentent un pourcentage 
d'homologie ou d'identite avec les sequences natives d'au moins 70%, de preference 
d'au moins 80% et avantageusement d'au moins 98 %. 

Les proteines d'interet de la fraction 21 du pool SEP positif ont ensuite ete 
analysees par spectrometrie de masse et/ou sequen<?age et recherche d'homologie dans 
les banques de donnees. Les resultats montrent la presence de cinq bandes de proteines 
migrant entre 22 et 5 kD dans la fraction 21 du pool SEP positif et des variants desdites 
proteines. 

Ces proteines sont le fragment C-terminal du Perlecan, qui commence a 
l'acide amine 3464 et se termine a l'acide amine 3707 de la sequence proteique 
complete, identifiee dans l'identificateur de sequences SEQ ID N° 2, le precurseur de 
la proteine plasmatique de liaison au retinol dont la sequence est donnee en SEQ ID N° 
4, le precurseur de l'activateur du ganglioside GM2 identifie en SEQ ID N° 8, la 
calgranuline B identifiee en SEQ ID N° 17 et la saposine B representee en SEQ ID N° 
24. Comme decrit ci dessus des homologues ou variants desdites proteines ont 
egalement ete identifies par sequensage. Ces sequences proteiques homologues ou 
variantes sont le produit de mutations au niveau des genes codant pour lesdites 
proteines. A titre d'exemple, la SEQ ID N° 9 presente 99 % d'homologie ou d'identite 
avec la SEQ ID N° 8 du precurseur de l'activateur du ganglioside GM2 et le fragment 
de SEQ ID N° 9 qui commence a l'acide amine 34 et se termine a I'acide amine 202 
presente 98,88 % d'homologie ou d'identite avec le fragment correspondant de la 
proteine native identifiee en SEQ ID N° 8. 

Exemple 10 : Mise en evidence des proteines dans un echantillon urinaire. 

Des echantillons d'urine provenant d'un individu SEP negatif et d'un 
patient SEP positif ont ete preleves. Ces echantillons d'urine ont ete purifies selon le 
protocole decrit precedemment. Les fractions d'elution finales 21 ont ete analysees 
separement par spectrometrie de masse. Le profil de masse de chaque fraction 
correspondant a chaque echantillon d'urine a ete compare au profil de masse obtenu 
pour les proteines identifiees dans les exemples precedents. Les resultats montrent que 
pour I'echantillon d'urine provenant du patient SEP positif les masses correspondent 
aux molecules (i) fragment C-terminal du Perlecan, (ii) precurseur de la proteine 
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activatrice du ganglioside GM2, (iii) calgranuline B et (iv) saposine B identifiees 
precedemment. Par contre aucune de ces masses n'a ete identifiee dans le profil de 
masse obtenu apres analyse de l'echantillon d'urine provenant de Pindividu SEP 
negatif. Le precede decrit est utilisable comme essai de diagnostic. 

5 

Exemple 1 1 : Essai en Western Blot. 

Des Western Blot ont ete realises sur differentes fractions d'urine brute ou 
purifiee comme decrit dans 1'exemple 2. Des echantillons d'urine provenant 
d'individus sains et de patients atteints de sclerose en plaques sont testes en parallele. 

10 Les echantillons sont deposes sur un gel d'electrophorese permettant de separer les 
differentes proteines en fonction de leur masse moleculaire sous Taction d'un champ 
electrique. Les Western Blot sont realises apres transfert des proteines du gel sur une 
membrane. Pour reveler les proteines transferees, la membrane est saturee en tampon 
de saturation, puis incubee avec un anticorps directement marque a la phosphatase 

15 alcaline. L'anticorps utilise est un anticorps anti-calgranuline (anticorps monoclonal de 
souris, clone CF 145 sous-type IgG 2b commercialise par la societe Valbiotech : 
reference MAS 696p lot PC96G696). Le substrat de Penzyme est le dichiorure de 3,3'- 
(U'-biphenyl)4,4'diazonium et 2-naphtalenyI phosphate de sodium (commercialise 
sous la denomination P Naphtyl acid phosphate Sigma ref. N7375 et 6 dianisine 

20 Tetrazotized D3502) est ajoute pour la revelation des bandes et la visualisation des 
proteines iiees a l'anticorps. Une molecule de masse moleculaire apparente d'environ 
14 000 est revelee dans les urines purifiees de patients atteints de SEP, avec un signal 
relativement intense. Cette proteine correspond a la calgranuline B (masse moleculaire 
apparente : 14 kD). Par contre, aucun signal n'est observe a partir d'urine d'individus 

25 sains. Cette observation confirme la presence de cette proteine specifiquement dans les 
urines de patients atteints de SEP et la mise en ceuvre d'un procede de detection 
utilisant un anticorps reconnaissant la proteine. 

Exemple 12 : Production d'anticorps monoclonaux. 
30 La production d'anticorps monoclonaux par ascite impose une 

compatibility du systeme H-2 entre l'hybridome et la souris productrice. 20 souris 
femelles Balb/c, agees de 6 semaines, subissent une injection de 0.5ml de Pristane (2-6- 



WO 01/05422 8 j PCT/FROO/02057 



10-14 acide tetramethylpentadecane) dans leur cavite peritoneale, pour la production 
d'ascite (Porter et al., 1972). Une semaine a 10 jours plus tard, 5.10 6 a 10.10 6 
hybridomes dilues dans 0.5ml de tampon sterile NaCl 0,1 45M, Na 2 HP0 4 10 mM, KC1 
2.7 mM, KH : P0 4 1.5 mM a pH 7.4. sont injectes par voie intraperitoneale. L'ascite 
5 apparait une a deux semaines plus tard. Les liquides d'ascites presents dans la cavite 
peritoneale sont alors recueillis avec une seringue apres incision du peritoine. Le 
liquide recueilli est centrifuge a 3000g pendant 15 minutes a temperature ambiante, 
filtre sur gaze pour eliminer le gras, puis tamponne en ajoutant l/20 6fnc de son volume 
de tris-HCl 1M a pH 8.0. Cette methode permet d'obtenir des quantites d'anticorps 10 

10 fois superieures a celles obtenues par culture d'hybridomes. 

Les immunogiobulines presentes dans le liquide d'ascite sont relarguees par les sels 
(sulfate d'ammonium ou sulfate de sodium). Le liquide d'ascite est precipite par le 
sulfate d'ammonium 40%. Apres 20 minutes au froid la solution est centrifugee 15 
minutes 8000g a 4°C. Le precipite est lave et resuspendu a froid dans une solution de 

15 sulfate d'ammonium 40% puis de nouveau centrifuge. Le nouveau precipite enrichi en 
IgG est remis en solution dans du tampon PBS et dialyse la nuit contre le tampon Tris- 
HCl 25 mM, NaCl 150 mM pH 7,4. Parallelement une colonne d'agarose-Proteine A 
(ou proteine G) (commercialisee sous forme lyophilisee, Pierce) est lavee 
extensivement avec le tampon Tris-HCl 25 mM, NaCl 150mM pH7.4. La solution 

20 enrichie en IgG est depose sur la colonne puis la colonne est lavee. Les igG retenues 
par la colonne sont eluees a pH acide (glycine 200 mM pH 2.8). Les fractions eluees 
sont neutralises avec un volume de Tris-Base 1M pH 10.5. Le contenu en 
immunogiobulines de chaque fraction recueillie est quantifiee par lecture d'absorbance 
a 280 nm (e l%,lcm = 14.0 Prahl et Porter 1968). Les fractions riches sont poolees. Le 

25 degre de purification des IgGs poolees est analyse par electrophorese en gel 
d'acryiamide en presence de SDS. Les IgGs purifiees sont dialysees une nuit contre le 
tampon Tris-HCl 25 mM, NaCl 150mM pH7.4, filtrees sterilement, aliquotees et 
conservees a -20°C. leur concentration finale est determinee par lecture de I'absorbance 
a 280 nm ou par dosage micro-BCA. Les peptides immunogenes references SEQ ID N° 

30 58, SEQ ID N° 54, SEQ ID N° 55, SEQ ID N° 56, SEQ ID N° 57, SEQ ID N° 58, SEQ 
ID N° 59 et SEQ ID N° 65 ont ete utilises pour la production d'anticorps 
monoclonaux, selon le protocole decrit ci dessus. Mais, il est a la portee de l'homme du 
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metier de definir d'autres protocoles pour la production d'anticorps monoclonaux, par 
exemple a partir des techniques decrites par Kohler et Milstein et par Galfre G. et al 
precedemment cites ou des techniques derivees de celles ci. 

Production de proteines recombinantes et d'anticorps polyclonaux et 
5 monoclonaux. 

Proteines recombinantes : 

Les proteines recombinantes GM2AP (SEQ ID NO :73) et Saposine B 
(SEQ ID NO :74) utilisees pour realiser la gamme etalon de cette etude ont ete 
produites en systeme procaryote et purifiees a partir des clones de ces deux proteines 
10 obtenus dans notre laboratoire en utilisant les methodes et protocoles bien connus de 
Phomme de Tart. 

Anticorps anti-GM2AP ou anti-Saposine B : 

Les anticorps anti-GM2AP ou anti-Saposine B utilises pour realiser 
l'etude ont ete soit produits dans notre laboratoire ou donnes genereusement. 

15 Des anticorps polyclonaux anti-Saposine B et anti-GM2AP (Li et al, Glycoconjugate, 
1984) ont ete utilises pour l'etude (cf les exemples ci-dessous) : ils sont denommes 
SAP84 et GM2AP84. 

Des anticorps polyclonaux anti-GM2AP ou anti-Saposine B ont ete 
produits et purifies dans le laboratoire en utilisant les protocoles et methodes bien 

20 connus de l'homme de Fart : 50 de proteine GM2AP ou Saposine B procaryote 
achetee ont ete injectes a des lapins aux jours JO, J28 et J56 ; deux injections de rappel 
ont ete realises une fois par mois pendant deux mois consecutifs. Les deux anticorps 
polyclonaux anti-GM2AP et deux anticorps polyclonaux anti-Saposine B ont ainsi ete 
obtenus et leur specificite vis-a-vis de la proteine recombinante a ete verifiee par 

25 Western blot et par Elisa. 

Des anticorps polyclonaux anti-peptides GM2AP ou Saposine B ont ete 
produits et purifies dans le laboratoire en utilisant les protocoles et methodes bien 
connus de Thomme de Tart : 75 \xg de peptides GM2AP ou Saposine B definis, 
produits et couples a KLH dans notre laboratoire ont ete injectes aux jours JO, J28 et 

30 J56 ; plusieurs boosts ont ete realises une fois par mois pendant 5 mois consecutifs 
avec injection de 75 jig a chaque fois. Quatre anticorps polyclonaux anti-peptides 
GM2AP, quatre anticorps polyclonaux anti-peptides Saposine B et quatre anticorps 
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polyclonaux de lapins anti-peptides MRP14 ont ainsi ete obtenus et leur specificite 
vis-a-vis de la proteine recombinante a ete verifiee par Western blot et par Elisa. La 
sequence des peptides GM2AP, Saposine B et MRP 14 choisis sont decrites_dans les 
figures de 1 a 3. 
5 II a ete obtenu : 

- un anticorps anti-melange de deux peptides de 13 et 15 acides amines de 
GM2AP : 189-190 ; un anticorps anti-peptide de 18 acides amines de GM2AP : 191- 
192 (cf. Figure 1), 

- un anticorps anti-melange de deux peptides de 13 et 19 acides amines de 
10 MRP 14 :193 ; un anticorps anti-peptide de 17 acides amines de MRP 14 : 195-196 (cf. 

Figure 2), 

- un anticorps anti-melange de trois peptides de 12, 15 et 15 acides 
amines de Saposine B: 74-75 ; un autre anticorps anti-melange de 3 peptides de 12, 15 
et 15 acides amines de Saposine B : 72-73 (cf. Figure 3). 

15 Des anticorps monoclonaux anti-fraction native ont ete produits et purifies 

dans le laboratoire en utilisant les protocoles et methodes bien connus de l'homme de 
Part. La « fraction native » correspond a la fraction dilution cytotoxique obtenue a 
partir du pool des 80 litres d'urine de patients SEP et apres purification. C'est la 
derniere fraction d'elution qui contient les trois proteines GM2AP, Saposine B, 

20 MRP14. 30 ^ig de cette fraction de purification ont ete injectes a trois souris aux jours 
JO, J 1 4, J28 et le prelevement a ete effectue a J38. Apres « screening » et fusion 
cellulaire, protocoles connus de l'homme de Tart pour l'etablissement d'hybridomes et 
d'anticorps monoclonaux, les hybridomes ont ete re-injectes a la souris et le liquide 
d'ascite a ete recupere 10 jours apres. Les anticorps ont ete purifies sur colonne 

25 sepharose-Proteine A et la specificite vis-a-vis de la fraction utilisee pour 
T immunisation a ete verifiee par Western blot et par Elisa. Ainsi quatre anticorps 
monoclonaux ont ete obtenus : 19C1A7, 3D3F9, 18C8C5 et 7D12A8. 

Exemple 13 : Dosage des proteines MRP 14 dans les urines par technique 

30 ELISA. 

Les proteines MRP 14, MRP8 et Pheterocomplexe MRP8/14 ont ete doses 
dans des urines humaines en utilisant (i) soit une technique de dosage Elisa selon le 
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procede connu de 1'homme de l'art et en utilisant les anticorps anti-MRP decrits dans 
les exemples precedents ; (ii) soit le kit 'MRP Enzyme Immunoassay' commercialise 
par BMA Biomedicals AG, Augst, Switzerland, en utilisant les anticorps du kit, le 
protocole etant realise suivant la notice du kit.. 
5 Detection de MRP 1 4 et MRP8/ 1 4 dans des urines. 

Les dosages a ete realises a partir de 17 urines d'individus issus de la 
population active (TS), de 27 urines de patients atteints de sclerose en plaques (SEP et 
de 7 urines de patients atteints d'autres maladies neurologiques (AMN). 

- La figure 4 illustre les taux de MRP8 doses dans ces urines : alors que la 
10 concentration en MRP8 est quasiment nulle dans les urines AMN, il n'y a pas vraiment 

de difference de distribution entre les urines TS et SEP. Notons cependant que les 
differences observees sont quasiment negligeables car les concentrations dosees sont 
extremement faibles. 

- La figure 5 illustre les taux de MRP14 doses dans les memes urines : 
15 alors qu'il n'y a pas vraiment de differences de distribution des concentrations entre les 

urines TS et AMN, les concentrations sont plus elevees dans certaines urines SEP. 

- La figure 6 illustre les taux d'heterodimere MRP8/14 doses dans les 
memes urines ralors qu'il n'y a pas vraiment de difference entre les concentrations des 
urines TS et AMN, on observe des plus fortes concentrations dans certaines urines 

20 SEP ? correspondant peut-etre a une sous population de patients SEP caracterisee par 
une activite de la maladie. MRRP8/14 dose dans les urines est un marqueur de 
l'activite de la maladie SEP caracterisee par un pic d'inflammation). 

- La figure 7 recapitulative confirme qu'il n'y a pas de difference 
significative de concentration en MRP8 et en MRP14 entre les urines TS, AMN et 

25 SEP, alors qu'une faible difference de concentration en MRP8/14 est observee entre 
ces urines, cette concentration etant plus elevee en moyenne dans les urines SEP et 
etant un marqueur de l'activite de la maladie (pic d'inflammation). 

Exemple 14 : Protocoles ELISA utilises pour le dosage des proteines 
30 GM2AP et Saposine B. 

Les proteines GM2AP ou Saposine B ont ete dosees dans des urines 
humaines en utilisant des anticorps polyclonaux anti-GM2AP ou anti-Saposine B ? en 
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suivant le protocole Elisa decrit par Gardas et al. (Glycoconjugate Journal 1, 37-42, 
1984). Les principales etapes sont brievement decrites ci-dessous : 

A chaque etape, les puits d'une microplaque de 96 puits sont remplis avec 
200 \i\ de la solution designee. Les puits sont d'abord « coates » avec une solution de 
5 GM2AP (proteine recombinante procaryote) diluee a 50 ng/ml dans un tampon 
carbonate-bicarbonate, pH 9,6. Apres incubation une nuit a 4°C, la solution est 
eliminee et les puits sont laves quatre fois avec du tampon PBS pH 7,4 contenant du 
Tween-20 0.05% (PBS-Tween). Les microplaques ainsi coatees sont stockees a 4°C 
pendant environ 2 semaines. 

10 Les echantillons d'urine a trois dilutions differentes (20x, 40x et 80x ou 

d'autres dilutions appropriees) sont incubes avec une dilution appropriee de l'anticorps 
polyclonal de lapin anti-GM2AP ou anti-Saposine B pendant une nuit a 4°C. Une serie 
de dilutions standard d'une proteine recombinante allant de 2,0 a 62,5 ng/ml est utilisee 
pour realiser la gamme etalon et sont traitee de la meme fa<?on. Toutes les dilutions sont 

15 faites en tampon PBS-Tween contenant 1 mg/ml d'ovalbumine. Ainsi, 0,2 ml de 
chaque solution incubee est ajoutee dans des puits « coates » en duplicat et les plaques 
sont laissees pendant 2 heures a temperature ambiante. Les puits sont alors laves quatre 
fois en PBS-Tween et remplis encore avec une solution d'anticorps de chevre anti-IgG 
de lapin couples a la peroxidase et diluee environ 1200 fois. Apres une incubation de 2 

20 heures a temperature ambiante, les puits sont laves quatre fois en PBS-Tween et 
remplis e nouveau avec le reactif de coloration. Le reactif de coloration consiste en 100 
mg d'acide 2,2'-azino-di-(3-ethylbenzothiazoline) sulfonique et 10 t ul de 30% de 
peroxide d'hydrogene pendant une heure a temperature ambiante et le degre de 
coloration de chaque micropuits est estime par lecture d'absorbance a 405 nm. 

25 Une courbe standard est construite en mettant en abscisse la concentration 

de GM2AP de la gamme etalon ou de Saposine B avec une echelle logarithmique et en 
ordonne le pourcentage d'absorbance avec une echelle lineaire. Le pourcentage 
d'absorbance de Fechantillon est le rapport d'absorbance entre I'echantillon d'urine et 
le controle qui contient seulement 1'antiserum, sans l'antigene soluble. 

30 ' Une solution de proteine recombinante GM2AP produite en systeme 

procaryote, et de concentration 3 mg/ml est diluee en tampon carbonate 50 mM, pH 9,6 
et 50^1 sont ajoutes dans chaque puits d'une microplaque a 96 puits, soit 50jil par puits 
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d'une solution a 0,5 ng/mi. Les plaques ainsi preparees sont incubees une nuit a 
temperature ambiante. L'anticorps polyclonal anti-GM2AP produit dans le laboratoire 
(lapin 79) a ete purifie et dilue en tampon PBS-Tween 0,05% en presence de serum de 
cheval 10%. Cette solution est diluee au 1/8000*™. La solution est utilisee pour realiser 
5 une gamme etalon avec 8 points de gamine couvrant les concentrations de 0 a 500 
ng/ml. Une preincubation est realisee pendant une nuit a temperature ambiante ente 100 
^il d'anticorps et 100 \xl d'echantillon d'urine a doser ou de solution proteine 
recombinante GM2AP ou Saposine B servant pour la gamme etalon. Apres lavage de la 
microplaque en PBS-Tween, 50^1 du melange d'incubation sont ajoutes par puits, puis 

10 incubes pendant deux heures a temperature ambiante. La microplaque est de nouveau 
lavee en PBS-Tween, puis 50 fal d'anticorps anti-IgG de lapin couple a la peroxidase et 
dilues au 1/5000 sont ajoutes dans chaque micropuits de ia plaque et incubes pendant 
deux heures a temperature ambiante. Apres de nouveaux lavages de la microplaque, 
\00\x\ d'OPD sont ajoutes dans chaque puits et incubes pendant 20 minutes a 

15 temperature ambiante. La coloration de chaque puits, proportionnelle a la 
concentration de GM2AP ou de Saposine B reconnue par I'anticorps specifique utilise, 
est estimee par lecture d'absorbance. 

Une solution de proteine recombinante GM2AP ou Saposine B produite 
20 en systeme procaryote, et de concentration 3 mg/ml est diluee en tampon carbonate 50 
mM, pH 9,6 et 50jil sont ajoutes dans chaque puits d'une microplaque a 96 puits, soit 
50fil par puits d'une solution a 1,5 jag /ml. Les plaques ainsi preparees sont incubees 
une nuit a temperature ambiante. Les anticorps polyclonaux anti-peptides GM2AP 
produits dans le laboratoire (lapin 190 et lapin 191) purifies sont utilises seuls ou en 
25 melange dilues au 1/1000 pour chacun en tampon PBS-Tween 0,05% en presence de 
serum de cheval 10%. La gamme etalon est realisee en utilisant de la proteine 
recombinante procaryote GM2AP ou Saposine B diluee de fa<?on a couvrir la gamme 
de concentration 0 a 1500 ng/ml avec 8 points. 100 \il d'anticorps (un anticorps ou les 
deux ensemble) sont pre-incubes en presence de 100|il d'echantillon d'urine a tester ou 
30 de solution GM2AP ou Saposine B recombinante, pendant une nuit a temperature 
ambiante. Apres lavage de la microplaque en PBS-Tween, 50^1 du melange 
d'incubation est ajoute par puits puis incubes pendant deux heures a temperature 
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ambiante. La microplaque est de nouveau lavee en PBS-Tween, puis 50 ul d'anticorps 
anti-IgG de lapin couple a la peroxidase, dilues au 1/5000, sont ajoutes dans chaque 
micropuits de la plaque et incubes pendant deux heures a temperature ambiante. Apres 
lavage de la microplaque, lOO^il d'OPD sont ajoutes dans chaque puits et incubes 
pendant 20 minutes a temperature ambiante. La coloration de chaque puits, 
proportionnelle a la concentration de GM2AP ou Saposine B reconnue par Tanticorps 
specifique utilise, est estimee par lecture d'absorbance. 

Exemple 15 : Dosage des proteines GM2AP dans les urines. 
La proteine GM2AP a ete dosee dans les urines de 22 patients atteints de 
sclerose en plaques (SEP), 5 patients atteints d'autres maladies neurologiques (OND) et 

9 individus choisis parmi la population active et recueillies pendant une visite medicale 
(Healthy), en suivant le protocole Elisa decrit ci-dessous, utilisant des anticorps 
polyclonaux anti-GM2AP. Les patients SEP selectionnes pour cette etude sont des 
patients tout azimut, c'est-a-dire avec differents stades et profits de la maladies, et 
differents traitements, etc... 

Les resultats du dosage sont rapportes dans la figure 8. Alors que 
seulement 0/5 urines OND et 2/9 urines dites 'Healthy' presentent une concentration en 
GM2AP superieure a 200 ng/ml , 10/22 (soit 45%) presentent une concentration 
superieure a 200 ng/ml. 

Ces resultats indiquent que si la proteine GM2AP est presente en tres 
faible concentration (<400 ng/ml) dans les urines d'individus de la population active, 
elle est presente en plus forte concentration dans les urines de patients SEP. Cependant 
12 urines SEP presentent egalement des taux faibles de GM2AP. Parmi ces 12 patients, 

10 sont en traitement. Les fortes concentrations urinaires de GM2AP semblent etre un 
marqueur de la pathologie SEP, et plus precisement un marqueur d'un stade ou d'une 
forme de la maladie, de Factivite de la maladie, et est certainement influence par tout 
traitement en cours. Notons que deux individus de la population active ont des 
concentrations elevees de GM2AP (ces deux cas ont ete inclus volontairement dans 
1'etude, car ils presentaient tous deux une activite gliotoxique dans leur urines 
contrairement aux autres individus de cette meme categories). II est impossible de 
savoir sMl s'agit d'individus sains, ou atteints d'une pathologie, ou des individus 



WO 01/05422 



88 



PCT/FR00/02057 



atteints d'une sclerose en plaques car les echantillons des individus dits « Healthy » ont 
ete preleves de maniere anonyme, sans connaissance du dossier clinique. 

Des concentrations urinaires plus elevees de GM2AP sont detectees dans 
les urines de patients SEP ; une concentration elevee de GM2AP peut etre alors un 
marqueur de la pathologie SEP, et plus precisement d'une forme de la maladie, d'un 
stade de la maladie, d'une periode d'activite, et peut etre influencee par tout traitement 
en cours. Ces concentrations urinaires elevees en GM2AP peut egalement avoir une 
valeur predictive d'un debut d'aggravation de la maladie, ou d'une SEP benigne en 
debut devolution, etc .... 

Les valeurs absolues des concentrations GM2AP detectees dans les urines 
sont dependantes de I'affinite et de la specificite de ranticorps utilise, mais d'une fapon 
generate, la tendance entre les trois groupes d'individus est conservee quelque soit 
Tanticorps utilise. 

Exemple 16 : Dosage des proteines Saposine B dans les urines. 

La proteine Saposine B a ete detectee dans les meme echantillons d'urines 
que ceux utilises pour l'etude de la detection de GM2AP. Les dosages ont ete realises 
en parallele avec ceux du GM2AP, dans une meme etude, en suivant le protocole Elisa 
decrit ci-dessous, utilisant des anticorps polyclonaux anti-Saposine B. 

Les resultats du dosage Saposine B sont reportes dans la Figure 9. 0/5 
urines OND et 2/9 urines Healthy presentent une concentration en Saposine B 
superieure a 2 ug/ml , alors que 6/22 (soit 27%) presentent une concentration 
superieure a 2 jig /ml. 

Ces resultats indiquent que la proteine Saposine B est presente dans 
chaque urine (population dite saine ou population dite malade) a des concentrations 
non negligeables, c'est-a-dire < 2u,g /ml. Ces resultats de dosage sont compatibles avec 
ceux decrits dans la bibliographic Cependant meme si la Saposine B est presente dans 
chaque urine, elle semble etre presente en plus forte concentration dans certaines urines 
SEP. Cette augmentation de concentration de saposine B dans les urines Sep est peut- 
etre masquee par la concentration basale de cette proteine a 1'etat ordinaire. Ainsi les 
fortes concentrations urinaires de Saposine B semblent etre un marqueur de la 
pathologie SEP. et plus precisement un marqueur d'un stade ou d'une forme de la 
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maladie, de l'activite de la maladie, et est certainement influencee par tout traitement 
en cours. La Saposine B dosee seule semble etre cependant un marqueur un peu moins 
discriminant d'une forme ou d'une activite de la maladie que le GM2AP. Notons 
encore uen fois que deux individus de la population active ont des concentrations 
elevees de Saposine B et que ce sont les deux meme individus qui presentaient aussi 
une forte concentration en GM2AP dans leurs urines. 

En conclusion, des concentrations urinaires plus elevees de Saposine B 
sont detectees dans les urines de patients SEP ; une concentration elevee de Saposine B 
peut etre alors un marqueur de la pathologie SEP, et plus precisement d'une forme de 
la maladie, d'un stade de la maladie, d'une periode d'activite, et peut etre influencee 
par tout traitement en cours. Ces concentrations urinaires elevees en GM2AP peut 
egalement avoir une valeur predictive d'un debut d'aggravation de la maladie, ou d'une 
SEP benigne en debut devolution, etc .... Mais d'une fa<?on generale, les fortes 
concentrations de Saposine B seules semblent etre des marqueurs moins discriminants 
que les fortes concentrations de GM2AP seules. 

Les valeurs absolues des concentrations Saposine B detectees dans les 
urines sont dependantes de Faffinite et de la specificite de l'anticorps utilise, mais 
d'une fa<?on generale, la tendance entre les trois groupes d'individus est conservee 
quelque soit l'anticorps utilise. 

Exemple 1 7 : Co-dosage des proteines GM2AP et Saposine B dans les 

urines. 

La Figure 10 reporte les concentrations de GM2AP dosee dans les 
echantillons d'urine decrites dans la Figure 5 par rapport a la concentration de Saposine 
B dosee dans ces memes echantillons et decrite dans la Figure 6. Dans ce graphe sont 
reportes les echantillons SEP (losanges fonces) et les echantillons OND et 'Healthy' 
(losanges blancs). 

Sur ce graphe, il apparait clairement que : 

- plus la concentration en GM2AP est elevee dans les urines, plus la 
concentration en Saposine B est elevee. (Nous avons montre que ce n'est pas un cas 
general avec d'autres proteines et que cela ne traduit pas une perturbation renale, avec 
le dosage de la creatinine en parallele pour chacun des echantillons testes.) ; 
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- les concentrations elevees de GM2AP et Saposine B sont caracteristiques 
des echantillons SEP (a Pexception des deux urines de la population active, 
mentionnees ci-dessus).Ces concentrations elevees conjointes de GM2AP et Saposine 
B sont des marqueurs de la pathologie SEP, plus precisement d'une fenetre de la 
5 maladie (quadran a droite et en haut du graphe). 

En conclusion, cette analyse confirme que des concentrations urinaires 
elevees de GM2AP (>400 ng /ml) et de Saposine B (>2 pg /ml) sont co-detectees dans 
les urines de patients SEP et peuvent representer des marqueurs de la pathologie SEP, 
plus precisement d'une forme de la maladie, d'un stade de la maladie, d'une periode 
10 d'activite, et peuvent etre influencee par tout traitement en cours. II est avantageux de 
doser les deux proteines en parallele dans chaque echantillons, et de considerer les 
deux concentrations. 

Dosage de GM2AP et Saposine B dans Purine de deux patients en 

cinetique. 

15 Patient SEP n°l - Forme Remittente Progressive. 

Des urines de ce patients ont ete prelevees au cours de revolution de sa 
maladie. Le patient a ete hospitalise a JO pour une poussee. II a subit a Jl un flash de 
corticoides puis a ete suivi dans le temps d'un point de vue clinique (le flash a apporte 
une amelioration clinique). La figure 1 1 montre le profil de dosage du GM2AP et de la 

20 Saposine B dans ces urines au cours de revolution, et la figure 12 montre le profil du 
produit des deux concentrations en GM2AP et Saposine B, traduisant une co-detection 
de concentrations elevees. Les concentrations en GM2AP et Saposine B elevees au 
moment de la poussee et de 1'hospitalisation, diminuent progressivement dans le temps 
apres le flash de corticoides jusqu'a 90 jours. 

25 Patient SEP n°2 - Forme Progressive. 

Des urines de ce patients ont ete prelevees au cours de 1'evolution de sa 
maladie. Le patient a ete hospitalise a JO pour une poussee. II a subit a Jl un flash 
d'Endoxan puis a ete suivi dans le temps d'un point de vue clinique (le flash a apporte 
une amelioration clinique et a J60, des signes d'aggravation de la maladie ont ete 

30 observes). La figure 13 montre le profil de dosage du GM2AP et de la Saposine B dans 
ces urines au cours de revolution, et la figure 14 montre le profil du produit des deux 
concentrations en GM2AP et Saposine B, traduisant une co-detection de concentrations 
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elevees. Les concentrations en GM2AP et Saposine B elevees au moment de la poussee 
et de Phospitalisation, diminuent progressivement dans le temps apres le flash 
d'Endoxan (ou encore appele cyclophosphamide) jusqu'a 23 jours et semblent 
augmenter pour devenir elevees a J60, montrant ainsi une parfaite correlation avec 
revolution des signes cliniques. 

Ces resultats confirment que : 

- des concentrations fortes de GM2AP et Sapsoine B dans les urines sont 
des marqueurs de la pathologies SEP, et en particulier la co-detection des fortes 
concentrations des deux proteines conjointement (traduit par le produit des deux 
concentrations) ; 

- les fortes concentrations de GM2AP et Saposine B dans les urines sont 
des marqueurs de Pactivite de la maladie (ici pendant la poussee) ou sont des 
marqueurs influences par les traitements immuno-suppresseurs comme les corticoides 
ou I'Endoxan qui abaissent les concentrations. 

Cet exemple illustre le fait que ces marqueurs peuvent etre utilises entre 

autres : 

- pour realiser un suivi therapeutique d'un patient et evaluer le benefice 
therapeutique d'un traitement pour un patient donne ; ou 

- de predire une aggravation de la maladie, predire un pic d'activite, etc... 

- de decider une (re)prise therapeutique anticipee sur les signes cliniques 

Exemple 18 : Correlation ente la detection des proteines MRP 14, GM2AP 
et Saposine B dans les urines et la gliotoxicite mesuree dans ces urines. 

Afin de verifier une correlation entre la presence de ces proteines seules 
ou en combinaison dans les urines et la gliotoxicite des urines, ont ete dosees en 
parallele les concentrations en proteine d'interet et la gliotoxicite d'un echantillonage 
d'urines de patients atteints de sclerose en plaques (SEP), de patients atteints d'autres 
maladies neurologiques (OND) et d'individus issus de la population active dit 
« Healthy ». Parmi les patients SEP, on note des patients avec differentes formes et 
stades de la maladie, sous traitement ou non, a differentes activites de la maladie. 

Les proteines MRP, GM2AP et Saposine B ont ete dosees dans des urines 
humaines en suivant les protocoles Elisa decrits ci-dessus. Les dosages analyses dans 
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cet exemples sont ceux decrits dans les exemples precedents. Chaque echantillon 
d'urine analyse en Elisa a ete analyse par le test MTT pour mesurer la gliotoxicite de 
chaque echantillon. La gliotoxicite est exprimee en pourcentage de cellules mortes 
(estime par colorimetrie en utilisant les sels de tetrazolium) d'une lignee cellulaire 
5 astrocytaire murine (CLTT1.1) apres 48 heures d'incubation en presence d'urine 
centrifuges 

La figure 15 represente la concentration en GM2AP en fonction de la 
gliotoxicite des urines determinee par test MTT. 

22 urines SEP (losanges gris), 5 urines AMN (losanges noirs) et 9 urines 
10 dites « Healthy » (losanges noirs) ont ete reportes sur le graphe. Ce sont les memes 
urines qui ont ete etudiees dans les exemples 15 et 16. On observe que toutes les urines 
temoins (OND et Healthy) ont des taux en GM2AP faibles (<400 ng/ml) et une 
gliotoxicite faibles (<15%), a F exception d'une urine temoin Healthy (deja commentee 
dans Fexemple 1 5) pour laquelle on observe une forte concentration en GM2AP et une 
15 gliotoxicite. 

Les urines SEP sont reparties en trois sous-populations : 

- urines a faible concentration en GM2AP (<400 ng /ml) et faible 
gliotoxicite (<15%), 

- urines a faible concentration en GM2AP (<400 ng /ml) et gliotoxicite 
20 (>1 5%), soit essentiellement 3 urines, 

- urines a forte concentration en GM2AP (>400 ng /ml) et forte 
gliotoxicite (>15%). 

Ces trois sous populations traduisent peut-etre des sous populations SEP, 
c'est-a-dire differentes formes ou stades de la maladie, differentes activites de la 
25 maladie, differents benefices therapeutiques, .... 

Cependant on peut noter que toutes les urines presentant une forte 
concentration en GM2AP presentent egalement une forte gliotoxicite. 

En conclusion : on observe une correlation entre concentration urinaire 
elevee en GM2AP et gliotoxicite (toutes les urines avec une forte concentration en 
30 GM2AP sont gliotoxiques (10/10), et toutes les urines avec une faible concentration en 
GM2AP ne sont pas gliotoxiques (<15%), a l'exception de 3 urines/12 SEP). Ceci 
traduit Timplication de la proteine GM2AP dans le mecanisme de gliotoxicite, seule ou 
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en combinaison, sous sa forme naturelle ou modifiee, mais reconnaissable par un 
anticorps anti-GM2AP. De plus la co-detection d'une forte concentration en GM2AP 
dans les urines et d'une forte gliotoxicite correle avec une sous population de patients 
atteints de SEP. 

5 La figure 16 represente la concentration en Saposine B en fonction de la 

gliotoxicite des urines determinee par test MTT. 

22 urines SEP (losanges gris), 5 urines AMN (losanges noirs) et 9 urines 
dites «Healthy » (losanges gris clair) ont ete reportes sur le graphe. Ce sont les memes 
urines qui ont ete etudiees dans les exemples .15 et 16. On observe que plus les urines 
10 sont riches en Saposine B, plus elles sont gliotoxiques. II y a une correlation assez nette 
entre concentration de Saposine B et gliotoxicite des urines. 

En conclusion : on observe une correlation entre concentration urinaire 
elevee en Saposine B et gliotoxicite. Ceci traduit Timplication de la proteine Saposine 
15 B dans le mecanisme de gliotoxicite, seule ou en combinaison, sous sa forme naturelle 
ou modifiee mais reconnaissable par Tanticorps anti-saposine B utilise pour le dosage. 

La figure 17 represente le produit des concentrations en GM2AP et 
Saposine B en fonction de la gliotoxicite des urines determinee par test MTT. 

20 Les 22 urines SEP (losanges gris), 5 urines AMN (losanges noirs) et 9 

urines dites «Healthy » (losanges gris clair) des exemples 15 et 16 ont ete reportes dans 
la figure 17. La gliotoxicite de ces urines est analysee en fonction du produit des 
concentrations en GM2AP et Saposine B, c'est-a-dire en fonction de la co-detection 
des deux proteines dans les urines. On observe tres nettement une correlation entre le 

25 produit des deux concentrations GM2AP et Saposine B et la gliotoxicite, bien plus 
importante qu'en ne considerant qu'une seule proteine. On observe que 5/5 des urines 
OND ont un produit de concentration GM2AP et Saposine B faible et une gliotoxicite 
faible ; 8/9 urines « Healthy » ont un produit de concentration GM2AP et SaposineB 
faible et/ou une gliotoxicite faible. Par contre, on distingue essentiellement trois sous- 

30 populations d' urines SEP : 

- urines a faible concentration en GM2AP.Saposine B et faible gliotoxicite 

(<15%), 
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- urines a forte concentration en GM2AP. Saposine B et forte gliotoxicite 

(>15%). 

Ces deux sous populations traduisent peut-etre des sous populations SEP, 
c'est-a-dire differentes formes ou stades de la maladie, differentes activites de la 
5 maladie, differents benefices therapeutiques, .... Cependant il est tres important de 
noter que toutes les urines presentant une forte concentration en GM2AP et Saposine 
B, c'est-a-dire ayant conjointement une forte concentration en GM2AP et Saposine B, 
presentent egalement une forte gliotoxicite. Les deux sous populations de patients SEP 
sont d'autant plus marquees et nettes que Ton considere conjointement les trois 
10 marqueurs : gliotoxicite, concentration elevee en GM2AP et concentration elevee en 
Saposine B. Ceci est confirme a la figure 18. 

En conclusion : on observe une correlation entre concentration urinaire 
elevee de GM2AP et Saposine B et Gliotoxicite. Toutes les urines avec une forte 
concentration en GM2AP et Saposine B sont gliotoxiques, et toutes les urines avec une 
15 faible concentration en GM2AP et Saposine B ne sont pas gliotoxiques (<15%), a 
F exception de 2 urines/22 SEP. Ceci traduit Timplication des deux proteines GM2AP 
et Saposine conjointement ou en combinaison dans le mecanisme de gliotoxicite, sous 
leur forme naturelle ou modifiee mais reconnaissable par les anticorps anti-GM2AP et 
anti-saposine B utilises pour le dosage. De plus la co-detection d'une forte 
20 concentration urinaire en GM2AP et Saposine B et d'une forte gliotoxicite correle avec 
une sous population de patients atteints de SEP (stade, forme, activite, traitement de la 
maladie ?), par rapport a une autre sous population. Ces trois marqueurs consideres 
conjointement permettent de discriminer entre deux sous populations de patients SEP. 

Evolution de la gliotoxicite et des concentrations en GM2AP et Saposine 
25 B en fonction de revolution de la maladie de deux patients apres et pendant traitement. 

La correlation entre gliotoxicite, forte concentration en GM2AP ET 
Saposine dans les urines et pathologie SEP a egalement ete confirmee en mesurant ces 
trois parametres dans Furine de deux patients au cours de revolution de leur maladie. 

Patient n°l : SEP forme remittente-progressive, hospitalise a JO pour une 
30 poussee et ayant repu un flash de corticotde a Jl. Apres le flash, il a montre une 
amelioration clinique jusqu'a J90 - (cf. figures 11,12), 
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Patient n°2 : SEP forme progressive, hospitalise a JO pour une poussee et 
ayant re<?u un flash d'Endoxan (encore appele cyclophosphamide) a Jl. A J60, il 
presente de nouveaux des signes cliniques d'aggravation de sa maladie - (cf. figures 
13,14). 

5 Pour les deux patients, il a ete montre : 

- une correlation entre la gliotoxicite urinaire et revolution clinique de la 
maladie (lorsque les signes cliniques sont severes, la gliotoxicite est elevee ; lorsque les 
signes cliniques diminuent suite au traitement, la gliotoxicite diminue et devient 
stationnaire ; lorsque les signes d'aggravation apparaissent apres le traitement, la 

1 0 gliotoxicite semble augmenter de nouveau), 

- une correlation entre le taux de gliotoxicite dans les urines de patients et 
les concentrations de GM2AP et Saposine B, et 

- une correlation entre les concentrations elevees de GM2AP et Saposine 
B et 1'evolution clinique de la maladie. 

15 En conclusion : le dosage des proteines GM2AP ET Saposine B dans les 

urines est un bon marqueur discriminatif d'une sous population de la SEP (stade, 
forme, activite, traitement de la maladie). Les proteines GM2AP et/ou Saposine B sont 
impliquees dans le mecanisme de gliotoxicite, seules ou en combinaison, sous leur 
forme naturelle ou sous une forme reconnaissable par les anticorps polyclonaux utilises 

20 pour leur dosage. Comme les proteines GM2AP et Saposine sont co-detectees en forte 
concentration dans les urines gliotoxiques, il est possible que ces deux proteines 
agissent en combinaison pour induire la gliotoxicite. 

Exemple 19 : Analyse immunohistochimique de F expression des proteines 
25 GM2A, SAPB, MRP 14 et MRP8 dans un systeme de culture producteur de gliotoxine 
in vitro (cultures de monocytes), ainsi que dans le tissu cerebral normal et pathologique 
de SEP et de temoins. 

Protocole : Des cultures de monocytes d'un patient atteint de SEP et d'un 
temoin sain ont ete realisees en parallele, selon le protocole present decrit brievement. 
30 A partir de sang peripherique de ces deux volontaires preleve sur ACD, les PBMC 
(Peripheral Blood Mononuclear Cells) sont isoles sur Ficoll en utilisant la technique 
connue de Thomme de Tart. Les cellules recuperes (au niveau de Tanneau) sont lavees 
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deux fois en milieu RPMI. Les cellules sont alors enumerees sur Kovas-slide et sont 
ensemencees en flacon primaire de 25 cm : ou sur lame Labteck (8 cupules) (en 
permanox) en milieu RPMI supplement^ avec 15% de serum AB humain a JO. Les 
cellules sont cultivees sur des lames alveolees de type « Labtek » afin de disposer d'un 

5 support direct pour 1'analyse des monocytes qui adherent au support et se differencient 
ulterieurement en macrophages. Pour les lames, 2.10 6 cellules sont ainsi ensemencees a 
raison de 0,25 10 6 cellules/puits. Pour les flacons, 4.10 6 cellules sont ensemencees a 
raison de 0,25 10 6 cellules/puits. A Jl, les cellules en suspension sont recuperees et les 
puits des Labteck ou les flacons sont laves deux fois en RPMI (au prealable chauffe a 

10 37°C) avant de rajouter du milieu RPMI supplements avec 5% de serum AB humain. 
A Jl, J3, J6, J9. J12 ou 14, J 15 le milieu de culture est change ; les surnageants sont 
preleves et les cellules fixees sur lames en utilisant les techniques connues de l'homme 
de Tart. A chaque changement de milieu, au moins deux lames ont ete fixees en 
paraformaldehyde et conservees pour Tanalyse immunohistochimique. 

15 Composition du milieu: RPMI (500 ml) avec 15ml de glutamate 200 

mM, 5 ml de pyruvate de sodium 100 nM, 5 ml d'acides amines non essentiels (lOOx), 
des antibiotiques penicilline et streptomycine 100 000 U et des anticorps anti- 
interferon humains a 1 00 U/|il. 

Resuitats : Quatre cultures de monocytes in vitro ont ete ainsi etudiees en 

20 cinetique : deux cultures de monocytes issus de sang d'individus controles et deux 
cultures de monocytes issus de patients SEP. A differents temps de la culture (JO, Jl, 
J3, J6, J9, J 12. ....), les surnageants correspondants ont ete egalement recuperes. Une 
fois la cinetique completee, les lames correspondant aux differents jours de cultures ont 
ete incubees en presence d'anticorps polyclonaux anti-GM2A, SAP-B, MRP-8 et 

25 MRP14. La gliotoxicite de chaque surnageant ainsi recupere a ete estime par test MTT. 
La concentration en proteine GM2AP, MRP 14 et Saposine B a egalement ete 
determinee dans chaque surnageant par protocole Elisa comme decrit dans les 
exemples 13 et 14. 

Les resuitats d'immunofluorescence sur cellules fixees sont resumes ci- 
30 dessous ; on peut noter : 

- une absence d'expression de MRP8 a tous les stades des 2 cultures 
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- une expression nette de MRP- 14 dans la peri ode entre J9 et J 15, 
retrouvee dans les deux cultures, quoique plus forte dans la culture SEP. Cette 
expression semble correler une etape de differentiation macrophagique. 

- une tres faible expression (faible intensite et faible nombre de cellules) 
5 est observee en debut de culture dans la culture temoin et correspond 

vraisemblablement a la presence physiologique de GM2A dans les lysosomes 
macrophagiques. 

- Dans la culture SEP, une expression beaucoup plus nette de GM2A (plus 
forte intensite et nombre de cellules plus important) est observee, avec un marquage 

10 cytoplasmique relativement homogene entre J3 et J6, disparait a J9 et est a nouveau 
notee a J14-J15 avec un marquage intense et localise a la peripheric cytoplasmique, 
dessinant le contour interne de la membrane plasmique. Ces observations ne sont pas 
retrouvees dans l'ensemble des lames temoins. 

L'analyse avec le anticorps anti-SAP-B n'a pas permis d'obtenir un 

1 5 marquage immuno-histochimique interpretable. 

Dans les cultures de monocytes SEP deja effectuees, 3/3 ont presente un 
pic de gliotoxicite a J9 et 2/3 un pic plus faible a J6. Aucun pic n'etant detecte dans les 
cultures de monocytes de 2/2 temoins non-SEP analyses en parallele. De meme, le 
dosage des proteines MRP14, GM2AP et Saposine B dans le surnageant des cultures 

20 cellulaires au cours de la cinetique a montre que les proteines SapB et GM2AP sont 
detectees par Elisa dans les surnageants des monocytes SEP et non dans ceux des 
monocytes temoins, aux jours J6 et surtout J9 de la culture ; les proteines ne sont pas 
detectees au-dela de cette cinetique. Notons que les anticorps utilises pour le dosage 
peuvent reconnaitre les formes physiologiques des proteines, mais egalement des 

25 formes complexees et/ou modifiees. 

On constate done que la periode J6-J9 pendant laquelle on observe une 
gliotoxicite la plus importante dans le surnageant, est couverte par la periode J3-J15 
pendant laquelle on observe une production moins differenciee du temoin negatif de 
GM2A dans les cellules avec des fluctuations quantitatives et qualitatives de son 

30 expression cellulaire (quantite d'expression et localisation cellulaire). 
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Exemple 20: Technique d'immunohistologie sur coupes de cerveaux en 

paraffine. 

Les coupes histologique preparees en paraffine sont deparaffinees en 
xylene et alcool avant de subir un pretraitement qui a pour but de demasquer les 
5 antigenes ; ce pretraitement peut corresponds a (i) deux fois 5 minutes sous micro- 
onde (750W) en presence d'un tampon citrate de sodium, acide citrique, (ii) un 
traitement a Facide par incubation 15 minutes dans une solution d'acide periodique 1% 
ou par incubation 5 minutes dans une solution d'acide formique 99%. Les peroxydases 
endogenes sont ensuite bloquees par incubation des lames 30 minutes en eau oxygenee 

10 1% puis lavage extensif en eau pendant 15 minutes. Le bruit de fond est bloque en 
incubant les lames 30 minutes en presence de PBS Triton 0.03%, 10% serum Donkey 
(pour les anticorps polyclonaux) ou 10% serum Goat (pour les anticorps 
monoclonaux). Un marquage avec F anticorps primaire est realise en appliquant 100 a 
200 ^il de solution d'anticorps primaire par lame (0.5 a 5 \xg /ml selon le titre) dans du 

15 PBS Triton 0.03% puis en incubant 2 heures a temperature ambiante. Les lames sont 
ensuite rincees 3 fois en PBS-Triton pendant 10 minutes. Un marquage anticorps 
secondaire est realise en utilisant des anticorps biotinyles capables de se fixer 
specifiquement aux anticorps primaires, par exemples des anti-IgG de lapin ou anti-IgG 
de souris dilues dans du PBS-Triton 0.03%. les lames sont lavees et incubees dans une 

20 solution pendant 2 heures (2 ^1 complexe streptavidine-biotine-peroxides, 1600 ul 
PBS-Triton 0.03%). Les lames sont de nouveau lavees avant d'etre revelees a Fabri de 
la lumiere dans le tampon A puis rincees a Feau avant observation microscopique. 
Tampon A pour 5 lames : 25 ml Tris0.05M pH 7.6, 2.5 ml Imidazole 1M, 15 ml eau 
sterile, 2 ml DAB 5 mg/ml, 5 ml Nickel d'ammonium 10%, 30 ul H : 0 2 1%. 

25 Les memes anticorps ont ete utilises pour une etude 

immunohistochimique, selon la technique decrite brievement ci-dessous ? sur lames 
paraffinees obtenues par coupe au microtome de cerveaux preleves post-mortem de 
SEP et de temoins decedes de pathologies non-neurologiques. 

Les resultats de Tanalyse sont resumes ci-dessous : 

30 II n'y a pas de marquage des cerveaux « non-SEP » et SEP dans la 

substance grise et la substance blanche «normale (non lesee) avec les differents 
anticorps anti- MRP8, MRP 14, GM2A. Une reactivite non specifique n'a pas permis 
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cTinterpreter les resultats avec Fanticorps anti-saposine B dans cette application 
immunohistochimique. 

Par contre on note, dans les zones de plaques des cerveaux SEP : 

- une reactivite anti-MRP 14 dans les cellules macrophagiques et 
5 microglials, ayant une distribution relativement homogene sur toute 1'etendue des 

zones de demyelinisation (plaques), 

- une plus faible (moins frequente) reactivite anti-MRP8 liee 
essentiellement aux infiltrats lymphoides perivasculaires 

- une nette reactivite anti-GM2A dans les macrophages et microgliocytes 
10 des zones de plaques, avec une densite particuliere dans les zones constituant le « mur 

glial » en limite peripherique de plaque. Un marquage de quelques astrocytes a aussi 

ete retrouve dans les zones de demyelinisation. 

Ces differentes observations montrent qu'il existe une hyperexpression 

particuliere des proteines MRP- 1 4 et GM2A dans les cultures de monocytes de SEP 
15 produisant une activite gliotoxique dans leur surnageant, ainsi que dans les zones 

definissant des plaques de demyelinisation dans les cerveaux de SEP. Elles temoignent 

done de la realite de la coincidence entre leur co-expression anormale, la production 

d'activite gliotoxique et les lesions de demyelinisation. 

De plus, leur production anorrmale dans le contexte de la SEP, dans les 
20 cellules macrophagiques sanguines ainsi que dans celles du cerveau, indique qu'il est 

fonde de realiser leur dosage dans les fluides biologiques pour correler leur quantite 

avec F activite lesionnelle et inflammatoire de la SEP. 

25 Exemple 21 : Mesure de r activite des cellules T par proliferation des 

cellules T (Sredni et aL, 1981). 

Les cellules T sont lavees deux fois en milieu de culture pour eliminer 
toute trace d'IL2 presente dans le milieu initial de culture. Des lymphocytes B (EBV- 
LCL) ou des monocytes/macrophages pris comme cellules presentatrices de Kantigene, 

30 sont irradiees a 10000 rads, lavees deux fois avec du milieu de culture (RPMI). 2 A0 A 
cellules T (2. 10 5 cellules /ml) et 2.10 4 cellules B autologues irradiees (2.10 5 cellules 
/ml) sont incubees ensemble en presence d'une gamme de concentration croissante de 
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Fantigene sous un volume final de 200 jil dans des micropuits. Apres 48 heures de 
culture a 37°C, 1 jiCi de 3H- thymidine dans 50 \x\ de milieu RPMI est ajoute dans 
chaque puits. Les cellules T, seules a se diviser, incorporent la thymidine tritiee dans 
l'ADN. Apres 18 heures de culture, les cellules de chaque micropuits sont recoltees sur 
5 des pastilles de laine de verre par aspiration. Apres lyse osmotique des cellules, la 
radioactivite incorporee dans FADN est absorbee sur les pastilles (cell Harvester 530, 
Inotech). Chaque pastille sechee est placee dans un tube plastique qui contient 2 ml de 
scintillant ; la radioactivite b adsorbee sur chacune des pastilles est quantifiee dans un 
compteur beta a scintillation liquide (LKB Rackbeta 1217). Les resultats sont exprimes 
10 comme moyenne arithmetique de cpm/culture ('coups par minute'). 

Exemple 22 : Protocole de detection de l'association entre les peptides et 
les molecules d'histocompatibilite (approche APC transformees avec un peptide se 
fixant au CMH I). 

15 1) Materiel : 

Les sources de molecules d'histocompatibilite sont actuellement de deux 
types principaux : les cellules mutantes et les molecules d'histocompatibilite purifiees. 

La cellule mutante utilisee est la cellule humaine T2 qui et un variant de la 
lignee Tl produite par fusion du lymphome T CEM et du lymphome B 721.174 (Salter 

20 and Cresswell Embo J 1986, 5: 943-949). Cette cellule qui est depourvue de 
transporters de peptides contient des chaines lourdes de molecules de classe I libres de 
peptides qui vont pouvoir accepter de peptides exogenes. 

Des molecules d'histocompatibilite de classe I purifiees par 
chromatographic d'affinite a partir de lignees de cellules B humaines transformees par 

25 l'EBV peuvent etre egalement utilisees. Dans ce cas les peptides endogenes doivent 
etre elimines par un traitement avec de Pureel.S M et de la soude 12.5 mM (pH 1 1.7) 
pendant 1 heure a 4°C,suivi de leur elimination par une colonne de desalage (PDLO, 
Pharmacia). Les molecules d'histocompatibilite sont immediatement remises en 
presence des peptides a tester dans un tampon PBS avec 0.05% Tvveen 20, 2 mM 

30 EDTA, 0.1% NP40 et6mM CHAPS, en presence de 2\xg/'m] B2m pour faciliter la 
reassociation (Gnjatic et al., Eur J Immunol 1995 25 : 1638-1642). 
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Les peptides testes ont en general 8 a 10 residus, parfois 1 1 ou 12. lis ont 
ete synthetises par Neosystems (Strasbourg), ou par Chiron mimotopes (Victoria, 
Australie). lis sont utilises a des concentrations variant de 100 jiM aO.l nM. 

2) Protocole de F assemblage (Connan et al., Eur J Immunol 1994, 24 : 
5 777 ; Couillin et al. Eur J Immunol 1995, 25 : 728-732). 

Des aliquotes de 8.105 cellules dans un volume de 64 repartis dans des 
tubes microfuge Eppendorf, sont mis en presence d'un tampon de lyse contenant 10 
mM PBS, pH 7.5 1% NP40, des inhibiteurs de proteases (1 mM PMSF, 100 nM 
iodoacetamide, 2 \xg /ml aprotinine, 10 leupeptine, 10 pepstatine et 10 jig/ml 

10 inhibiteur de trypsine). La lyse se fait en presence des peptides a tester pendant 30 
minutes ou 1 heure a 37°C. Apres elimination du materiel non solubilise par une 
centrifugation a 15 000 tours /minute a 4°C, le sumageant et additionne de 140 ^1 de 
PBS contenant 0.05% de Tween 20, 3 mM d'azide de sodium, 1 mM PMSF et 10 
mg/ml d'albumine bovine. Chaque echantillon est incube pendant 20 heures a 4°C 

15 dans 2 puits d'une plaque a microtitration de type Nunc,Maxisorb, prealablement 
recou verts d'un anticorps monoclonal (10 ng /ml en PBS) qui reconnait les molecules 
d'histocompatibilite ayant une(des) conformation(s) conforme(s) pour la presentation 
de peptides et semblable(s) a celle(s) presente(s) a la surface des cellules. La plaque 
recouverte d'anticorps est prealablement saturee par de Falbumine bovine a 10 mg /ml 

20 dans du PBS-Tween avant la mise de Fechantillon. Le second anticorps qui permet la 
detection de Fassemblage des molecules d' histocompatibility est dirige contre la B2m. 
II est couple soit a la biotine (NHS-LC biotin, Pierce) soit a la phosphatase alcaline (P- 
552, Sigma) et est incube a 2 \ig /ml pendant une heure a 37°C. Dans le cas de Femploi 
de la biotine, une incubation de 45 minutes a 20-25°C avec de la streptavidine couplee 

25 a la phosphatase alcaline (E-2636, Sigma) est realisee. L'activite de la phosphatase 
alcaline est mesuree en utilisant comme substrat le 4-methyl-umbellifcryl-phosphate 
(M-8883, Sigma) a 100 ^M dans de la diethanolamine 50 mM, pH 9.5 avec du MgC12 
1 mM. La lecture est faite a 340/460 nm a Faide d'un cytofluorimetre. 

3) Stabilite des complexes HLA/peptides : 

30 La stabilite des complexes precites a ete etudiee car elle conditionne la 

bonne presentation de Fantigene et Finduction de la reponse T. A cet effet, on a utilise 
soit du HLA purifie, soit le lysat de la cellule T2. Avec le HLA purifie, on a elimine les 
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peptides endogenes (comme decrit en 2)) puis on l'a mis en presence du peptide a tester 
en tube Eppendorf a 37°C, pendant des temps variables de quelques minutes a plusieurs 
jours. La phase suivante d'incubation sur plaque de 96 puits (comme decrit en 2) avec 
1'anticorps anti-HLA se fait pendant une heure a 37°C. La revelation est effectuee de 
5 maniere classique. Avec le lysat de la cellule T2, toutes les incubations sont egalement 
faites a 37°C, apres ajout de tous les inhibiteurs de proteases. 
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REVINDICATIONS 

1. Utilisation d'au moins un polypeptide comprenant au moins un 
fragment d'une proteine pour obtenir une composition diagnostique, pronostique, 
5 prophylactique ou therapeutique destinee a detecter, prevenir ou traiter un etat 
pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune, ladite proteine etant choisie parmi les proteines dont la sequence peptidique a 
Petat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ 
ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID N° 10, SEQ ID N° 1 1, 

10 SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ ID 
N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 22, 
SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID 
N° 28 et SEQ ID N° 29, et les sequences peptidiques qui presentent au moins 70 % 
d'identite, de preference au moins 80 % d'identite et avantageusement au moins 98 % 

15 d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a SEQ ID N° 
8 et SEQ ID N° 10 a SEQ ID N° 29, et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur 
de Pactivateur du ganglioside GM2, de la calgranuline B et de la saposine B. 

20 2. Utilisation d'au moins deux polypeptides en combinaison, lesdits 

polypeptides comprenant chacun au moins un fragment d'une proteine, pour obtenir 
une composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, prevenir ou traiter un etat pathologique associe a une maladie degenerative 
et/ou neurologique et/ou auto-immune, ladite proteine etant choisie parmi les proteines 

25 dont la sequence peptidique a Petat natif correspond a une sequence peptidique choisie 
parmi SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID N° 10, SEQ ID N° 29, et les sequences 
peptidiques qui presentent au moins 70 % d'identite, de preference au moins 80 % 
d'identite et avantageusement au moins 98 % d'identite avec l'une quelconque des 
sequences peptidiques SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID N° 10 a SEQ ID N° 29, 

30 et les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
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plasmatique de liaison aii retinol, du precurseur de l'activateur du ganglioside GM2, de 
la calgranuline B et de la saposine B. 

3. Utilisation d'au moins un polypeptide comprenant au moins un 
fragment d'une proteine pour obtenir une composition diagnostique, pronostique, 

5 prophylactique ou therapeutique destinee a detecter, prevenir ou traiter un etat 
pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune, ladite proteine etant choisie parmi les proteines dont la sequence peptidique a 
Petat natif correspond a SEQ ID N° 2, SEQ ID N° 4, SEQ ID N° 8, SEQ ID N° 17 et 
SEQ ID N° 24 et les sequences peptidiques qui presentent au moins 70 % d'identite, de 
10 preference au moins 80 % d'identite et avantageusement au moins 98 % d'identite avec 
Tune quelconque des sequences peptidiques SEQ ID N° 2, SEQ ID N° 4, SEQ ID N° 8, 
SEQ ID N° 1 7 et SEQ ID N° 24. 

4. Utilisation selon la revendication 3, de cinq polypeptides en 
combinaison, lesdits polypeptides comprenant chacun au moins un fragment d'une 

15 proteine, pour obtenir une composition diagnostique, pronostique, prophylactique ou 
therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un etat pathologique 
associe a une maladie degenerative et/ou neurologique et/ou auto-immune, ladite 
proteine etant choisie parmi les proteines dont la sequence peptidique a l'etat natif 
correspond a SEQ ID N° 2, SEQ ID N° 4, SEQ ID N° 8, SEQ ID N° 17 et SEQ ID N° 

20 24 et les sequences peptidiques qui presentent au moins 70 % d'identite, de preference 
au moins 80 % d'identite et avantageusement au moins 98 % d'identite avec 1'une 
quelconque des sequences peptidiques SEQ ID N° 2,. SEQ ID N° 4, SEQ ID N° 8, SEQ 
ID N° 17 et SEQ ID N° 24. 

5. Utilisation selon i'une quelconque des revendications I a 4, caracterisee 
25 en ce que la sequence peptidique dudit polypeptide comprend une sequence choisie 

parmi Tune quelconque des SEQ ID N° 2, SEQ ID N° 4, SEQ ID N° 8, SEQ ID N° 17 
et SEQ ID N° 24. 

6. Utilisation selon Tune quelconque des revendications 1 a 4, caracterisee 
en ce que la sequence peptidique dudit polypeptide consiste en une sequence choisie 

30 parmi Tune quelconque des SEQ ID N° 2, SEQ ID N° 4, SEQ ID N° 8, SEQ ID N° 1 7 
et SEQ ID N° 24. 
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7. Utilisation d'un fragment polypeptidique defini dans la revendication 1 
ou dans la revendication 3 pour la preparation d'un peptide immunogene, caracterise en 
ce que ledit peptide comprend tout ou partie d'au moins une des sequences referencee 
SEQ ID N° 58 a 65. 

5 8. Utilisation d'au moins un fragment nucleotidique, pour obtenir une 

composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune, selon laquelle ledit fragment 
nucleotidique est choisi parmi des fragments qui codent pour au moins un fragment 

10 d'une proteine, ladite proteine etant choisie parmi les proteines dont la sequence 
peptidique a 1'etat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ 
ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID N° 10, SEQ 
ID N° 1 1, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 
16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ 

15 ID N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 
27, SEQ ID N° 28 et SEQ ID N° 29 et les sequences peptidiques qui presentent au 
moins 70 % d'identite, de preference au moins 80 % et avantageusement au moins 98 
% d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a SEQ ID 
N° 8 et SEQ ID N° 10 a 29, les fragments complementaires desdits fragments et les 

20 fragments qui codent pour les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisie parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Factivateur du ganglioside GM2, de la calgranuline B et de la saposine B. 

9. Utilisation selon la revendication 8, caracterisee en ce que ledit 
25 fragment nucleotidique code pour ladite proteine. 

10. Utilisation selon la revendication 9, caracterisee en ce que la sequence 
peptidique de ladite proteine a Fetat natif consiste en une sequence choisie parmi Tune 
quelconque des SEQ ID N° 1 a 8 et SEQ ID N° 10 a 29 et les sequences peptidiques ou 
les fragments desdites sequences appartenant a une meme famille de proteines choisi es 

30 parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de Factivateur du ganglioside GM2, de la calgranuline B et de la saposine 
B. 
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11. Utilisation d'au moins un fragment nucleotidique pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un 

5 fragment d'une sequence nucleique choisie parmi Tune quelconque des SEQ ID N° 30, 
SEQ ID N° 31, SEQ ID N° 32, SEQ ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID 
N° 36, SEQ ID N° 37, SEQ ID N° 38, SEQ ID N° 39, SEQ ID N° 40, SEQ ID N° 41, 
SEQ ID N° 42, SEQ ID N° 43, SEQ ID N° 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ 
ID N° 47, SEQ ID N° 48, SEQ ID N° 49 et SEQ ID N° 50, SEQ ID N° 51, SEQ ID N° 
10 52, SEQ ID N° 53, SEQ ID N° 54, SEQ ID N° 55, SEQ ID N° 56, SEQ ID N° 57, SEQ 
ID N° 67, SEQ ID N° 66, SEQ ID N° 69, SEQ ID N° 70 et SEQ ID N° 71 et leurs 
sequences complementaires. 

12. Utilisation d'un ligand specifique d'un polypeptide ou d'un fragment 
nucleotidique selon Tune quelconque des revendications precedentes pour obtenir une 

15 composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune. 

13. Utilisation selon Tune quelconque des revendications precedentes, 
caracterisee en ce que la maladie degenerative et/ou auto-immune est la sclerose en 

20 plaques. 

14. Procede pour detecter au moins une proteine associee a une maladie 
degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 
Ton met en contact l'echantillon biologique avec au moins un ligand specifique d'au 
moins un polypeptide, ledit polypeptide comprenant au moins un fragment d'une 

25 proteine et ladite proteine etant choisie parmi ]es proteines dont la sequence peptidique 
a Fetat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, 
SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID N° 10, SEQ ID N° 
1 1, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ 
ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 

30 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ 
ID N° 28 et SEQ ID N° 29 et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 % 
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d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a SEQ ID N° 
8 et SEQ ID N° 10 a 29, et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
5 Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B, puis on 
detecte la formation d'un complexe entre ledit polypeptide et ledit ligand. 

15. Procede selon la revendication 14, caracterise en ce que ledit ligand est 
un anticorps monoclonal, un anticorps polyclonal, un recepteur, un substrat d'activite 
enzymatique ou une enzyme dont ledit polypeptide est un cofacteur. 

10 16. Procede pour detecter au moins un ligand associe a une maladie 

degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 
Ton met en contact Pechantillon biologique avec au moins un polypeptide comprenant 
au moins un fragment d'une proteine, ladite proteine etant choisie parmi les proteines 
dont la sequence peptidique a i'etat natif correspond a SEQ ID N° 1, SEQ ID N° 2, 

15 SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5 SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, 
SEQ ID N° 1 0, SEQ ID N° 1 1 , SEQ ID N° 1 2, SEQ ID N° 1 3, SEQ ID N° 1 4, SEQ ID 
N° 15, SEQ ID N° 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, 
SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID 
N° 26, SEQ ID N° 27, SEQ IDN° 28 et SEQ ID N° 29, les sequences peptidiques qui 

20 presentent au moins 70 % d'identite, de preference au moins 80 % d'identite et 
avantageusement au moins 98 % d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID N° 10 a SEQ ID N° 29, et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique 

25 de liaison au retinol, du precurseur de Pactivateur du ganglioside GM2, de la 
calgranuline B et de la saposine B, puis on detecte la formation d'un complexe entre 
ledit polypeptide et ledit ligand. 

17. Procede selon la revendication 16, caracterise en ce que le ligand est 
un anticorps, un recepteur, un substrat d'activite enzymatique ou une enzyme dont ledit 

30 polypeptide est un cofacteur. 
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18. Procede selon Tune quelconque des revendications 14 a 17, caracterise 
en ce que la sequence dudit polypeptide comprend une sequence peptidique choisie 
parmi Tune quelconque des SEQ ID N° 1 a 8 et SEQ ID N° 10 a 29. 

19. Procede selon Tune quelconque des revendications 14 a 17, caracterise 
5 en ce que la sequence dudit polypeptide consiste en une sequence peptidique choisie 

parmi Tune quelconque des SEQ ID N° 1 a 8 et SEQ ID N° 10 a 29. 

20. Procede selon Tune quelconque des revendications 14 a 19, caracterise 
en ce que Techantillon biologique est 1'urine, le liquide cephalo-rachidien ou le serum. 

21. Procede selon Tune quelconque des revendications 14 a 20, caracterise 
10 en ce que la maladie degenerative et/ou auto-immune est la sclerose en plaques. 

22. Polypeptide caracterise en ce qu'il comprend au moins un fragment 
d'une proteine dont la sequence peptidique correspond a SEQ ID N° 9, ledit fragment 
comprenant au moins une mutation par rapport a la sequence de reference SEQ ID N° 
8. 

15 23. Polypeptide selon la revendication 22, caracterise en ce qu'il 

comprend au moins deux mutations par rapport a la sequence de reference SEQ ID N° 

8. 

24. Polypeptide selon la revendication 22, caracterise en ce qu'il est choisi 
parmi les polypeptides qui comprennent la . sequence en acides amines 

20 FSWDNCFEGKDPAVIR, referencee SEQ ID N° 68 et la sequence en acides amines 
YSLPKSEFAVPDLELP, referencee SEQ ID N° 72. 

25. Polypeptide selon Tune des revendications 22 a 24, caracterise en ce 
qu'il comprend une proteine dont la sequence peptidique correspond a SEQ ID N° 9. 

26. Polypeptide selon Tune des revendications 22 a 25, caracterise en ce 
25 qu'il consiste en une proteine dont la sequence peptidique correspond a SEQ ID N° 9. 

27. Utilisation d'au moins un polypeptide selon Tune quelconque des 
revendications 22 a 26 pour obtenir une composition diagnostique, pronostique, 
prophylactique ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un 
etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 

30 immune. 

28. Utilisation selon la revendication 26, caracterisee en ce que le 
polypeptide tel que defini dans Tune quelconque des revendications 22 a 26 est utilise 
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en melange avec au moins un polypeptide tel que defini dans Fune quelconque des 
revendications 1 a 5. 

29. Procede pour detecter au moins un ligand associe a une maladie 
degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 

5 Ton met en contact P echantillon biologique avec au moins un polypeptide tel que 
defini dans Tune quelconque des revendications 22 a 26, puis on detecte la formation 
d'un complexe entre ledit polypeptide et le ligand. 

30. Procede selon la revendication 29, caracterise en ce que Ton met en 
10 contact Fechantillon biologique avec un polypeptide tel que defini dans Tune 

quelconque des revendications 22 a 26 et avec au moins un polypeptide tel que defini 
dans l'une quelconque des revendications 1 a 5. 

31. Procede selon la revendication 29 ou 30, caracterise en ce que ledit 
15 ligand est un anticorps, un recepteur, un substrat d'activite enzymatique ou une enzyme 

dont ledit polypeptide est un cofacteur. 

32. Procede pour detecter au moins un polypeptide tel que defini dans 
Tune quelconque des revendications 22 a 26 dans un echantillon biologique caracterise 

20 en ce que Ton met en contact Fechantillon biologique avec au moins un ligand 
specifique dudit polypeptide, puis on detecte la formation d'un complexe entre ledit 
polypeptide et ledit ligand. 

33. Procede selon la revendication 32, caracterise en ce que ledit ligand est 
25 anticorps monoclonal, un anticorps polyclonal, un recepteur, un substrat d'activite 

enzymatique ou une enzyme dont ledit polypeptide est un cofacteur. 

34. Procede selon la revendication 30 ou 31, caracterise en ce que Ton met 
en contact Fechantillon biologique avec un ligand tel que defini dans l'une quelconque 

30 des revendications 31 et 33 et au moins un ligand specifique d'au moins un polypeptide 
tel que defini dans l'une quelconque des revendications 1 a 5, puis on detecte la 
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formation de complexes entre lesdits polypeptides et iesdits ligands specifiques desdits 
polypeptides. 

35. Procede selon la revendication 34, caracterise en ce que le ligand est 
5 un anticorps monoclonal, un anticorps polyclonal, un recepteur, un substrat d'activite 

enzymatique ou une enzyme dont ledit polypeptide est un cofacteur. 

36. Fragment nucleotidique caracterise en ce qu'il code pour un 
polypeptide tel que defini dans Tune quelconque des revendications 22 a 26. 

10 

37. Utilisation d'un fragment nucleotidique pour obtenir une composition 
diagnostique, pronostique, prophylactique ou therapeutique destinee a detecter, 
pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou auto-immune, selon laquelle ledit fragment nucleotidique est Ie 

15 fragment nucleotidique defini dans la revendication 35, eventuellement en association 
avec au moins un fragment nucleotidique tel que defini dans Tune quelconque des 
revendications 8 a 11, et les fragments complementaires desdits fragments. 

38. Procede selon Tune quelconque des revendications 29 a 35, caracterise 
20 en ce que 1'echantillon biologique est 1'urine, le liquide cephalo-rachidien ou le serum. 

39. Procede selon Tune quelconque des revendications 29 a 36 caracterise 
en ce que la maladie degenerative et/ou auto-immune est la sclerose en plaques. 

25 40. Procede pour detecter au moins un polypeptide tel que defini dans 

Tune quelconque des revendications 1 a 5 ou dans Tune quelconque des revendications 
22 a 26, selon lequel on preleve un echantillon d'un fluide biologique d'un patient 
presentant un etat pathologique associe a une maladie degenerative et/ou neurologique 
et/ou auto-immune et eventuellement apres purification dudit echantillon de fluide 

30 biologique, on analyse par spectrometrie de masse le profil de masse obtenu a partir du 
fluide biologique et on compare a un profil de masse de reference. 
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41. Utilisation d'au moins un polypeptide comprenant au moins un 
fragment d'une proteine pour obtenir une composition diagnostique, pronostique, 
prophylactique ou therapeutique destinee a detecter, prevenir ou traiter un etat 
pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 

5 immune, ladite proteine etant choisie parmi les proteines dont la sequence peptidique a 
I 'etat natif correspond a SEQ ID N° 8, SEQ ID N°9, SEQ ID N° 10, SEQ ID N° 11, 
SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ ID 
N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 22, 
SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID 

10 N° 28 et SEQ ID N° 29, et les sequences peptidiques qui presentent au moins 70 % 
d'identite, de preference au moins 80 % d'identite et avantageusement au moins 98 % 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 8 a SEQ ID N° 
29, et les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisies parmi le precurseur de 1'activateur du ganglioside 

15 GM2, de la calgranuline B et de la saposine B, et de preference SEQ ID Nos :8, 9, 1 7 et 
24. 

42. Utilisation, selon la revendication 41, dans laquelle les sequences 
peptidiques sont comprennent les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisies parmi le precurseur de 

20 Tactivateur du ganglioside GM2 et de la saposine B. 

43. Utilisation, selon Tune quelconque des revendications 41 ou 42, qui 
est associee a l'utilisation d'une detection d'une activite gliotoxique. 

25 44. Precede de diagnostic ou de pronostic dans lequel on dose au moins un 

polypeptide, selon Tune quelconque des revendications 41 a 43, pour detecter ou 
prevenir un etat pathologique, le dosage permettant d'obtenir une valeur de 
concentration qui est comparer a une valeur seuil representative d'une maladie 
degenerative et/ou neurologique et/ou auto-immune. 

30 

45. Procede, selon la revendication 44, dans lequel la valeur seuil est 
obtenu par un test ELISA pour un echantillon d'urine, cette valeur etant de : 
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• 400 ng/ml pour le precurseur de l'activateur du ganglioside GM2, pour l'anticorps 
GM2AP84, et 

• 2 jig/ml pour la saposine B, pour l'anticorps SAPB84. 

46. Procede de diagnostic ou de pronostic dans lequel on detecte au moins 
un polypeptide, selon Tune quelconque des revendications 41 a 43, pour prevenir un 
etat pathologique, la detection s'effectuant dans des cellules ou dans les surnageants 
desdites cellules d'un patient susceptible d'etre atteint par une maladie degenerative 
et/ou neurologique et/ou auto-immune. 

47. Procede, selon la revendication 46, dans lequel la detection s'effectue 
sur des cellules monocytes ou macrophages ou dans les surnageants de ces cellules 
issues d'un patient susceptible d'etre atteint par une maladie degenerative et/ou 
neurologique et/ou auto-immune. 

48. Procede, selon 1'une quelconque des revendications 46 ou 47, dans 
lequel la detection s'effectue sur des cellules ou dans les surnageants de ces cellules en 
culture, apres un delai compris entre 6 et 12 jours de culture, preferentiellement apres 9 
jours. 

49. Procede, selon 1'une quelconque des revendications 46 ou 47, dans 
lequel la detection s'efFectue sur des cellules, in vivo ou ex vivo, preferentiellement 
monocytes ou macrophages, dans des cerveaux de patient susceptible d'etre atteint par 
une maladie degenerative et/ou neurologique et/ou auto-immune. 

50. Utilisation ou procede, selon Tune quelconque des revendications 41 a 
49, caracterisee en ce que la maladie degenerative et/ou neurologique et/ou auto- 
immune est la sclerose en plaques ou bien une forme (progressive, remittente, 
remittente-progressive) ou phase d'activite (poussees) de cette maladie. 

51. Utilisation d'au moins un polypeptide comprenant au moins un 
fragment d'une proteine pour tester l'efficacite d'un agent therapeutique, ladite 
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proteine etant choisie parmi les proteines dont la sequence peptidique a 1'etat natif 
correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, 
SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID N° 9, SEQ ID N° 10, SEQ ID N° 
11, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ 
5 ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 
22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ 
ID N° 28 et SEQ ID N° 29, les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 % 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les 
10 sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de l'activateur du ganglioside GM2, de la 
calgranuline B et de la saposine B. 

15 52. Utilisation d'au moins un polypeptide comprenant au moins un 

fragment d'une proteine pour la preparation d'une composition pharmaceutique 
destinee au traitement d'une maladie degenerative et/ou neurologique et/ou auto- 
immune, telle que la sclerose en plaques, ladite proteine etant choisie parmi les 
proteines dont la sequence peptidique a l'etat natif correspond a SEQ ID N° 1, SEQ ID 

20 N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID 
N° 8, SEQ ID N° 9, SEQ ID N° 10, SEQ ID N° 11, SEQ ID N° 12, SEQ ID N° 13, 
SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID 
N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, 
SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29, les 

25 sequences peptidiques qui presentent au moins 70 % d'identite de preference au moins 
80 % d'identite et avantageusement au moins 98 % d'identite avec l'une quelconque 
des sequences peptidiques SEQ ID N° 1 a 29, et les sequences peptidiques ou les 
fragments desdites sequences appartenant a une meme famille de proteines choisie 
parmi le perlacan, le precurseur de la proteine plasmatique de liaison au retinol, du 

30 precurseur de 1'activateur du ganglioside GM2, de la calgranuline et de la saposine. 
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53. Utilisation selon la revendication 51 ou 52, caracterisee en ce que le 
polypeptide est choisi parmi SEQ ID N° 2, 4,8, 9, 17, 24. 

54. Utilisation d'au moins un fragment nucleotidique, pour tester 
5 Fefficacite d'un agent therapeutique pour un etat pathologique associe a une maladie 

degenerative et/ou neurologique et/ou auto-immune, selon laquelle ledit fragment 
nucleotidique est choisi parmi les fragments qui codent pour au moins un fragment 
d'une proteine, ladite proteine etant choisie parmi les proteines dont la sequence 
peptidique a Fetat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ 

10 ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ IDN° 9, SEQ 
ID N° 10, SEQ ID N° 1 1, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 
15, SEQ ID N° 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ 
ID N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 
26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29, les sequences peptidiques qui 

15 presentent au moins 70 % d'identite, de preference au moins 80 % et avantageusement 
au moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 
1 a 29, et les fragments complementaires desdits fragments et les fragments qui codent 
pour les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisie parmi le perlecan, le precurseur de la proteine 

20 plasmatique de liaison au retinol, du precurseur de 1'activateur du ganglioside GM2, de 
la calgranuline B et de la saposine B. 

55. Utilisation pour tester Fefficacite d'un agent therapeutique pour un 
etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 

25 immune, de proteines recombinantes et/ou codees par tout ou partie des fragments 
nucleotidiques definis a la revendication 54. 

56. Utilisation d'au moins un fragment nucleotidique pour la preparation 
d'une composition pharmaceutique destinee au traitement d'une maladie degenerative 

30 et/ou neurologique et/ou auto-immune, telle que la sclerose en plaques, selon laquelle 
ledit fragment nucleotidique est choisi parmi des fragments qui codent pour au moins 
un fragment d'une proteine, ladite proteine etant choisie parmi les proteines dont la 



WO 01/05422 



115 



PCT/FROO/02057 



sequence peptidique a 1'etat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 
3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ IDN° 
9, SEQ ID N° 10, SEQ ID N° 1 1, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ 
ID N° 15, SEQ ID N° 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 
5 20, SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ 
ID N° 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29, les sequences peptidiques 
qui presentent au moins 70 % d'identite, de preference au moins 80 % et 
avantageusement au moins 98 % d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° 1 a 29, et les fragments complementaires desdits fragments et 
10 les fragments qui codent pour les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisie parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
l'activateur du ganglioside GM2, de la calgranuline B et de la saposine B. 

15 57. Utilisation pour la preparation d'une composition pharmaceutique 

destinee au traitement d'une maladie degenerative et/ou neurologique et/ou auto- 
immune, telle que la sclerose en plaques, de proteines recombinantes et/ou codees par 
tout ou partie des fragments nucleotidiques definis a la revendication 56. 

20 58. Utilisation selon la revendication 54 ou 56, caracterisee en ce que ledit 

fragment nucleotidique code pour ladite proteine. 

59. Utilisation selon la revendication 58, caracterisee en ce que la 
sequence peptidique de ladite proteine a Tetat natif consiste en une sequence choisie 

25 parmi Tune quelconque des SEQ ID N° 1 a 29, les sequences peptidiques qui 
presentent au moins 70 % d'identite de preference au moins 80 % d'identite et 
avantageusement au moins 98 % d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° 1 a 29, et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 

30 precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B. 
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60. Utilisation selon la revendication 59, caracterisee en ce que les 
polypeptides sont choisis parmi SEQ ID N° 2, 4, 8, 9, 1 7, 24. 

61. Utilisation d'au moins un fragment nucleotidique, pour tester 
5 refficacite d'un agent therapeutique pour un etat pathologique associe a une maladie 

degenerative et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un 
fragment d'une sequence nucleique choisie parmi Tune quelconque des SEQ ED N° 30, 
SEQ ID N° 31, SEQ ID N° 32, SEQ ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID 
N° 36, SEQ ID N° 37, SEQ ID N° 38, SEQ ID N° 39, SEQ ID N° 40, SEQ ID N° 41, 
10 SEQ ID N° 42, SEQ ID N° 43, SEQ ID N° 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ 
ID N° 47, SEQ ID N° 48, SEQ ID N° 49 et SEQ ID N° 50, SEQ ID N° 51, SEQ ID N° 
52, SEQ ID N° 53, SEQ ID N° 54, SEQ ID N° 55, SEQ ID N° 56, SEQ ID N° 57, SEQ 
ID N° 66, SEQ ID N° 67, SEQ ID N° 69, SEQ ID N°70 , SEQ ID N° 71, et leurs 
sequences complementaires. 

15 

62. Utilisation d'au moins un fragment nucleotidique pour la preparation 
d'une composition pharmaceutique destinee au traitement d'une maladie degenerative 
et/ou neurologique et/ou auto-immune, telle que la sclerose en plaques selon laquelle 
ledit fragment est un fragment d'une sequence nucleique choisie parmi Tune 

20 quelconque des SEQ ID N° 30, SEQ ID N° 31, SEQ ID N° 32, SEQ ID N° 33, SEQ ID 
N° 34, SEQ ID N° 35, SEQ ID N° 36, SEQ ID N° 37, SEQ ID N° 38, SEQ ID N° 39, 
SEQ ID N° 40, SEQ ID N° 41, SEQ ID N° 42, SEQ ID N° 43, SEQ ID N° 44, SEQ ID 
N° 45, SEQ ID N° 46 et SEQ ID N° 47, SEQ ID N° 48, SEQ ID N° 49 et SEQ ID N° 
50, SEQ ID N° 51, SEQ ID N° 52, SEQ ID N° 53, SEQ ID N° 54, SEQ ID N° 55, SEQ 

25 ID N° 56, SEQ ID N° 57, SEQ ID N° 66, SEQ ID N°67, SEQ ID N° 69, SEQ ID N°70 
, SEQ ID N° 71, et leurs sequences complementaires. 

63. Utilisation selon la revendication 61 ou 62, caracterisee en ce que la 
sequence nucleique est choisie parmi SEQ ED N° 30, 31, 42, 53. 

30 
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64. Utilisation de la lycorine pour la preparation d'une composition pour 
la prevention et/ou le traitement de maladie degenerative et/ou neurologique et/ou auto- 
immune. 
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LISTE DE SEQUENCES 
<110> BIOMERIEUX STELHYS 

<120> Utilisation d'un polypeptide pour detecter, prevenir ou 
traiter un etat pathologique associe a une maladie 
degenerative, neurologique ou auto- immune 

<130> SEP22 

<140> 
<141> 



<150> FR9909372 
15 <151> 1999-07-15 

<160> 75 

<170> Patentln Ver. 2.1 

20 

<210> 1 
<211> 4393 
<212> PRT 

<213> Homo sapiens 
<400> 1 

Met Gly Trp Arg Ala Pro Gly Ala Leu Leu Leu Ala Leu Leu Leu His 
15 10 15 

30 Gly Arg Leu Leu Ala Val Thr His Gly Leu Arg Ala Tyr Asp Gly Leu 
20 25 30 



Ser Leu Pro Glu Asp lie Glu Thr Val Thr Ala Ser Gin Met Arg Trp 
35 40 45 

Thr His Ser Tyr Leu Ser Asp Asp Glu Asp Met Leu Ala Asp Ser lie 
50 55 60 



Ser Gly Asp Asp Leu Gly Ser Gly Asp Leu Gly Ser Gly Asp Phe Gin 
40 65 70 75 80 

Met Val Tyr Phe Arg Ala Leu Val Asn Phe Thr Arg Ser lie Glu Tyr 
85 90 95 

45 Ser Pro Gin Leu Glu Asp Ala Gly Ser Arg Glu Phe Arg Glu Val Ser 
100 105 110 

Glu Ala Val Val Asp Thr Leu Glu Ser Glu Tyr Leu Lys He Pro Gly 
115 120 125 



Asp Gin Val Val Ser Val Val Phe He Lys Glu Leu Asp Gly Trp Val 
130 135 140 



Phe Val Glu Leu Asp Val Gly Ser Glu Gly Asn Ala Asp Gly Ala Gin 
55 145 150 155 160 



He Gin Glu Met Leu Leu Arg Val He Ser Ser Gly Ser Val Ala Ser 
165 170 175 . 
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Tyr Val Thr Ser Pro Gin Gly Phe Gin Phe Arg Arg Leu Gly Thr Val 
180 185 190 

Pro Gin Phe Pro Arg Ala Cys Thr Glu Ala Glu Phe Ala Cys His Ser 
195 200 205 

Tyr Asn Glu Cys Val Ala Leu Glu Tyr Arg Cys Asp Arg Arg Pro Asp 
210 215 220 

Cys Arg Asp Met Ser Asp Glu Leu Asn Cys Glu Glu Pro Val Leu Gly 
225 230 235 240 



15 



lie Ser Pro Thr Phe Ser Leu Leu Val Glu Thr Thr Ser Leu Pro Pro 
245 250 255 



Arg Pro Glu Thr Thr lie Met Arg Gin Pro Pro Val Thr His Ala Pro 

260 265 270 

20 Gin Pro Leu Leu Pro Gly Ser Val Arg Pro Leu Pro Cys Gly Pro Gin 

275 280 285 



25 



Glu Ala Ala Cys Arg Asn Gly His Cys He Pro Arg Asp Tyr Leu Cys 

290 295 300 

Asp Gly Gin Glu Asp Cys Glu Asp Gly Ser Asp Glu Leu Asp Cys Gly 

305 310 315 320 



Pro Pro Pro Pro Cys Glu Pro Asn Glu Phe Pro Cys Gly Asn Gly His 
30 325 330 335 

Cys Ala Leu Lys Leu Trp Arg Cys Asp Gly Asp Phe Asp Cys Glu Asp 
340 345 350 

35 Arg Thr Asp Glu Ala Asn Cys Pro Thr Lys Arg Pro Glu Glu Val Cys 
355 360 365 



40 



Gly Pro Thr Gin Phe Arg Cys Val Ser Thr Asn Met Cys He Pro Ala 
370 375 380 

Ser Phe His Cys Asp Glu Glu Ser Asp Cys Pro Asp Arg Ser Asp Glu 

385 390 395 400 



Phe Gly Cys Met Pro Pro Gin Val Val Thr Pro Pro Arg Glu Ser He 

45 405 410 415 

Gin Ala Ser Arg Gly Gin Thr Val Thr Phe Thr Cys Val Ala He Gly 
420 425 430 

50 Val Pro Ala Pro Phe Leu He Asn Trp Arg Leu Asn Trp Gly His He 
435 440 445 



55 



Pro Ser Gin Pro Arg Val Thr Val Thr Ser Glu Gly Gly Arg Gly Thr 
450 455 460 

Leu lie He Arg Asp Val Lys Glu Ser Asp Gin Gly Ala Tyr Thr Cys 
465 470 475 480 
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Glu Ala Met Asn Ala Arg Gly Met Val Phe Gly He Pro Asp Gly Val 
485 490 495 

Leu Glu Leu Val Pro Gin Arg Ala Gly Pro Cys Pro Asp Gly His Phe 
5 500 505 510 

Tyr Leu Glu His Ser Ala Ala Cys Leu Pro Cys Phe Cys Phe Gly He 
515 520 525 

10 Thr Ser Val Cys Gin Ser Thr Arg Arg Phe Arg Asp Gin He Arg Leu 
530 535 540 

Arg Phe Asp Gin Pro Asp Asp Phe Lys Gly Val Asn Val Thr Met Pro 
545 550 555 560 

15 

Ala Gin Pro Gly Thr Pro Pro Leu Ser Ser Thr Gin Leu Gin He Asp 
565 570 575 

Pro Ser Leu His Glu Phe Gin Leu Val Asp Leu Ser Arg Arg Phe Leu 
20 580 585 590 

Val His Asp Ser Phe Trp Ala Leu Pro Glu Gin Phe Leu Gly Asn Lys 
595 600 605 

25 Val Asp Ser Tyr Gly Gly Ser Leu Arg Tyr Asn Val Arg Tyr Glu Leu 
610 615 620 

Ala Arg Gly Met Leu Glu Pro Val Gin Arg Pro Asp Val Val Leu Val 
625 630 635 640 

30 

Gly Ala Gly Tyr Arg Leu Leu Ser Arg Gly His Thr Pro Thr Gin Pro 
645 650 655 

Gly Ala Leu Asn Gin Arg Gin Val Gin Phe Ser Glu Glu His Trp Val 
35 660 665 670 

His Glu Ser Gly Arg Pro Val Gin Arg Ala Glu Leu Leu Gin Val Leu 
675 680 685 

40 Gin Ser Leu Glu Ala Val Leu He Gin Thr Val Tyr Asn Thr Lys Met 
690 695 700 

Ala Ser Val Gly Leu Ser Asp He Ala Met Asp Thr Thr Val Thr His 
705 710 715 720 

45 

Ala Thr Ser His Gly Arg Ala His Ser Val Glu Glu Cys Arg Cys Pro 
725 730 735 

He Gly Tyr Ser Gly Leu Ser Cys Glu Ser Cys Asp Ala His Phe Thr 
50 740 745 750 

Arg Val Pro Gly Gly Pro Tyr Leu Gly Thr Cys Ser Gly Cys Ser Cys 
755 760 765 

55 Asn Gly His Ala Ser Ser Cys Asp Pro Val Tyr Gly His Cys Leu Asn 
770 775 780 

Cys Gin His Asn Thr Glu Gly Pro Gin Cys Lys Lys Cys Lys Ala Gly 
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785 790 795 800 

Phe Phe Gly Asp Ala Met Lys Ala Thr Ala Thr Ser Cys Arg Pro Cys 
805 810 815 

5 

Pro Cys Pro Tyr He Asp Ala Ser Arg Arg Phe Ser Asp Thr Cys Phe 
820 825 830 

Leu Asp Thr Asp Gly Gin Ala Thr Cys Asp Ala Cys Ala Pro Gly Tyr 
10 835 840 845 

Thr Gly Arg Arg Cys Glu Ser Cys Ala Pro Gly Tyr Glu Gly Asn Pro 
850 855 860 

15 He Gin Pro Gly Gly Lys Cys Arg Pro Val Asn Gin Glu He Val Arg 
865 870 875 880 

Cys Asp Glu Arg Gly Ser Met Gly Thr Ser Gly Glu Ala Cys Arg Cys 
885 890 895 

20 

Lys Asn Asn Val Val Gly Arg Leu Cys Asn Glu Cys Ala Asp Arg Ser 
900 905 910 

Phe His Leu Ser Thr Arg Asn Pro Asp Gly Cys Leu Lys Cys Phe Cys 
25 915 920 925 

Met Gly Val Ser Arg His Cys Thr Ser Ser Ser Trp Ser Arg Ala Gin 
930 935 940 

30 Leu His Gly Ala Ser Glu Glu Pro Gly His Phe Ser Leu Thr Asn Ala 
945 950 955 960 

Ala Ser Thr His Thr Thr Asn Glu Gly He Phe Ser Pro Thr Pro Gly 
965 970 975 

35 

Glu Leu Gly Phe Ser Ser Phe His Arg Leu Leu Ser Gly Pro Tyr Phe 
980 985 990 

Trp Ser Leu Pro Ser Arg Phe Leu Gly Asp Lys Val Thr Ser Tyr Gly 
40 995 1000 1005 

Gly Glu Leu Arg Phe Thr Val Thr Gin Arg Ser Gin Pro Gly Ser Thr 
1010 1015 1020 

45 Pro Leu His Gly Gin Pro Leu Val Val Leu Gin Gly Asn Asn He He 
1025 1030 1035 1040 

Leu Glu His His Val Ala Gin Glu Pro Ser Pro Gly Gin Pro Ser Thr 
1045 1050 1055 

50 

Phe He Val Pro Phe Arg Glu Gin Ala Trp Gin Arg Pro Asp Gly Gin 
1060 1065 1070 

Pro Ala Thr Arg Glu His Leu Leu Met Ala Leu Ala Gly lie Asp Thr 
55 1075 1080 1085 



Leu Leu He Arg Ala Ser Tyr Ala Gin Gin Pro Ala Glu Ser Arg Val 
1090 1095 1100 
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Ser Gly He Ser Met Asp Val Ala Val Pro Glu Glu Thr Gly Gin Asp 
1105 1110 1115 1120 

5 Pro Ala Leu Glu Val Glu Gin Cys Ser Cys Pro Pro Gly Tyr Arg Gly 
1125 1130 1135 

Pro Ser Cys Gin Asp Cys Asp Thr Gly Tyr Thr Arg Thr Pro Ser Gly 
1140 1145 1150 

10 

Leu Tyr Leu Gly Thr Cys Glu Arg Cys Ser Cys His Gly His Ser Glu 
1155 1160 1165 

Ala Cys Glu Pro Glu Thr Gly Ala Cys Gin Gly Cys Gin His His Thr 
15 1170 1175 1180 

Glu Gly Pro Arg Cys Glu Gin Cys Gin Pro Gly Tyr Tyr Gly Asp Ala 
1185 1190 1195 1200 

20 Gin Arg Gly Thr Pro. Gin Asp Cys Gin Leu Cys Pro Cys Tyr Gly Asp 
1205 1210 1215 

Pro Ala Ala Gly Gin Ala Ala His Thr Cys Phe Leu Asp Thr Asp Gly 
1220 1225 1230 

25 

His Pro Thr Cys Asp Ala Cys Ser Pro Gly His Ser Gly Arg His Cys 
1235 1240 1245 

Glu Arg Cys Ala Pro Gly Tyr Tyr Gly Asn Pro Ser Gin Gly Gin Pro 
30 1250 1255 1260 

Cys Gin Arg Asp Ser Gin Val Pro Gly Pro He Gly Cys Asn Cys Asp 
1265 1270 1275 1280 

35 Pro Gin Gly Ser Val Ser Ser Gin Cys Asp Ala Ala Gly Gin Cys Gin 
1285 1290 1295 

Cys Lys Ala Gin Val Glu Gly Leu Thr Cys Ser His Cys Arg Pro His 
1300 1305 1310 

40 

His Phe His Leu Ser Ala Ser Asn Pro Asp Gly Cys Leu Pro Cys Phe 
1315 1320 1325 

Cys Met Gly He Thr Gin Gin Cys Ala Ser Ser Ala Tyr Thr Arg His 
45 1330 1335 1340 

Leu He Ser Thr His Phe Ala Pro Gly Asp Phe Gin Gly Phe Ala Leu 
1345 1350 1355 1360 

50 Val Asn Pro Gin Arg Asn Ser Arg Leu Thr Gly Glu Phe Thr Val Glu 
1365 1370 1375 

Pro Val Pro Glu Gly Ala Gin Leu Ser Phe Gly Asn Phe Ala- Gin Leu 
1380 1385 1390 

55 

Gly His Glu Ser Phe Tyr Trp Gin Leu Pro Glu Thr Tyr Gin Gly Asp 
1395 1400 1405 
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Lys Val Ala Ala Tyr Gly Gly Lys Leu Arg Tyr Thr Leu Ser Tyr Thr 
1410 1415 1420 

Ala Gly Pro Gin Gly Ser Pro Leu Ser Asp Pro Asp Val Gin lie Thr 
5 1425 1430 1435 1440 

Gly Asn Asn lie Met Leu Val Ala Ser Gin Pro Ala Leu Gin Gly Pro 
1445 1450 1455 

10 Glu Arg Arg Ser Tyr Glu lie Met Phe Arg Glu Glu Phe Trp Arg Arg 
1460 1465 1470 

Pro Asp Gly Gin Pro Ala Thr Arg Glu His Leu Leu Met Ala Leu Ala 
1475 1480 1485 

15 

Asp Leu Asp Glu Leu Leu He Arg Ala Thr Phe Ser Ser Val Pro Leu 
1490 1495 1500 

Val Ala Ser He Ser Ala Val Ser Leu Glu Val Ala Gin Pro Gly Pro 
20 1505 1510 1515 1520 

Ser Asn Arg Pro Arg Ala Leu Glu Val Glu Glu Cys Arg Cys Pro Pro 
1525 1530 1535 

25 Gly Tyr He Gly Leu Ser Cys Gin Asp Cys Ala Pro Gly Tyr Thr Arg 
1540 1545 1550 

Thr Gly Ser Gly Leu Tyr Leu Gly His Cys Glu Leu Cys Glu Cys Asn 
1555 1560 1565 

30 

Gly His Ser Asp Leu Cys His Pro Glu Thr Gly Ala Cys Ser Gin Cys 
1570 1575 1580 

Gin His Asn Ala Ala Gly Glu Phe Cys Glu Leu Cys Ala Pro Gly Tyr 
35 1585 1590 1595 1600 

Tyr Gly Asp Ala Thr Ala Gly Thr Pro Glu Asp Cys Gin Pro Cys Ala 
1605 1610 1615 

40 Cys Pro Leu Thr Asn Pro Glu Asn Met Phe Ser Arg Thr Cys Glu Ser 
1620 1625 1630 

Leu Gly Ala Gly Gly Tyr Arg Cys Thr Ala Cys Glu Pro Gly Tyr Thr 
1635 1640 1645 

45 

Gly Gin Tyr Cys Glu Gin Cys Gly Pro Gly Tyr Val Gly Asn Pro Ser 
1650 1655 1660 

Val Gin Gly Gly Gin Cys Leu Pro Glu Thr Asn Gin Ala Pro Leu Val 
50 1665 1670 1675 1680 

Val Glu Val His Pro Ala Arg Ser He Val Pro Gin Gly Gly Ser His 
1685 1690 1695 

55 Ser Leu Arg Cys Gin Val Ser Gly Arg Gly Pro His Tyr Phe Tyr Trp 
1700 1705 1710 



Ser Arg Glu Asp Gly Arg Pro Val Pro Ser Gly Thr Gin Gin Arg His 
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1715 1720 1725 

Gin Gly Ser Glu Leu His Phe Pro Ser Val Gin Pro Ser Asp Ala Gly 
1730 1735 1740 

5 

Val Tyr lie Cys Thr Cys Arg Asn Leu His Arg Ser Asn Thr Ser Arg 
1745 1750 1755 1760 

Ala Glu Leu Leu Val Thr Glu Ala Pro Ser Lys Pro He Thr Val Thr 
10 1765 1770 1775 

Val Glu Glu Gin Arg Ser Gin Ser Val Arg Pro Gly Ala Asp Val Thr 
1780 1785 1790 

15 Phe He Cys Thr Ala Lys Ser Lys Ser Pro Ala Tyr Thr Leu Val Trp 
1795 1800 1805 

Thr Arg Leu His Asn Gly Lys Leu Pro Thr Arg Ala Met Asp Phe Asn 
1810 1815 1820 

20 

Gly He Leu Thr He Arg Asn Val Gin Leu Ser Asp Ala Gly Thr Tyr 
1825 1830 1835 1840 

Val Cys Thr Gly Ser Asn Met Phe Ala Met Asp Gin Gly Thr Ala Thr 
25 1845 1850 1855 

Leu His Val Gin Ala Ser Gly Thr Leu Ser Ala Pro Val Val Ser He 
1860 1865 1870 

30 His Pro Pro Gin Leu Thr Val Gin Pro Gly Gin Leu Ala Glu Phe Arg 
1875 1880 1885 

Cys Ser Ala Thr Gly Ser Pro Thr Pro Thr Leu Glu Trp Thr Gly Gly 
1890 1895 1900 

35 

Pro Gly Gly Gin Leu Pro Ala Lys Ala Gin lie His Gly Gly He Leu 
1905 1910 1915 1920 

Arg Leu Pro Ala Val Glu Pro Thr Asp Gin Ala Gin Tyr Leu Cys Arg 
40 1925 1930 1935 

Ala His Ser Ser Ala Gly Gin Gin Val Ala Arg Ala Val Leu His Val 
1940 1945 1950 

45 His Gly Gly Gly Gly Pro Arg Val Gin Val Ser Pro Glu Arg Thr Gin 
1955 I960 1965 

Val His Ala Gly Arg Thr Val Arg Leu Tyr Cys Arg Ala Ala Gly Val 
1970 1975 1980 

50 

Pro Ser Ala Thr He Thr Trp Arg Lys Glu Gly Gly Ser Leu Pro Pro 
1985 1990 1995 2000 

Gin Ala Arg Ser Glu Arg Thr Asp He Ala Thr Leu Leu He Pro Ala 
55 2005 2010 2015 

lie Thr Thr Ala Asp Ala Gly Phe Tyr Leu Cys Val Ala Thr Ser Pro 
2020 2025 2030 
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Ala Gly Thr Ala Gin Ala Arg He Gin Val Val Val Leu Ser Ala Ser 
2035 2040 2045 

5 Asp Ala Ser Gin Pro Pro Val Lys He Glu Ser Ser Ser Pro Ser Val 
2050 2055 2060 

Thr Glu Gly Gin Thr Leu Asp Leu Asn Cys Val Val Ala Gly Ser Ala 
2065 2070 2075 2080 

10 

His Ala Gin Val Thr Trp Tyr Arg Arg Gly Gly Ser Leu Pro His His 
2085 2090 2095 

Thr Gin Val His Gly Ser Arg Leu Arg Leu Pro Gin Val Ser Pro Ala 
15 2100 2105 2110 

Asp Ser Gly Glu Tyr Val Cys Arg Val Glu Asn Gly Ser Gly Pro Lys 
2115 2120 2125 

20 Glu Ala Ser He Thr Val Ser Val Leu His Gly Thr His Ser Gly Pro 
2130 2135 2140 

Ser Tyr Thr Pro Val Pro Gly Ser Thr Arg Pro He Arg He Glu Pro 
2145 2150 2155 2160 

25 

Ser Ser Ser His Val Ala Glu Gly Gin Thr Leu Asp Leu Asn Cys Val 
2165 2170 2175 

Val Pro Gly Gin Ala His Ala Gin Val Thr Trp His Lys Arg Gly Gly 
30 2180 2185 2190 

Ser Leu Pro Ala Arg His Gin Thr His Gly Ser Leu Leu Arg Leu His 
2195 2200 2205 

35 Gin Val Thr Pro Ala Asp Ser Gly Glu Tyr Val Cys His Val Val Gly 
2210 2215 2220 

Thr Ser Gly Pro Leu Glu Ala Ser Val Leu Val Thr He Glu Ala Ser 
2225 2230 2235 2240 

40 

Val He Pro Gly Pro He Pro Pro Val Arg He Glu Ser Ser Ser Ser 
2245 2250 2255 

Thr Val Ala Glu Gly Gin Thr Leu Asp Leu Ser Cys Val Val Ala Gly 
45 2260 2265 2270 

Gin Ala His Ala Gin Val Thr Trp Tyr Lys Arg Gly Gly Ser Leu Pro 
2275 2280 2285 

50 Ala Arg His Gin Val Arg Gly Ser Arg Leu Tyr He Phe Gin Ala Ser 
2290 2295 2300 

Pro Ala Asp Ala Gly Gin Tyr Val Cys Arg Ala Ser Asn Gly Met Glu 
2305 2310 2315 2320 

55 

Ala Ser He Thr Val Thr Val Thr Gly Thr Gin Gly Ala Asn Leu Ala 
2325 2330 2335 
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Tyr Pro Ala Gly Ser Thr Gin Pro lie Arg lie Glu Pro Ser Ser Ser 
2340 2345 2350 

Gin Val Ala Glu Gly Gin Thr Leu Asp Leu Asn Cys Val Val Pro Gly 
5 2355 2360 2365 

Gin Ser His Ala Gin Val Thr Trp His Lys Arg Gly Gly Ser Leu Pro 
2370 2375 2380 

10 Val Arg His Gin Thr His Gly Ser Leu Leu Arg Leu Tyr Gin Ala Ser 
2385 2390 2395 2400 

Pro Ala Asp Ser Gly Glu Tyr Val Cys Arg Val Leu Gly Ser Ser Val 
2405 2410 2415 

15 

Pro Leu Glu Ala Ser Val Leu Val Thr lie Glu Pro Ala Gly Ser Val 
2420 2425 2430 

Pro Ala Leu Gly Val Thr Pro Thr Val Arg lie Glu Ser Ser Ser Ser 
20 2435 2440 2445 

Gin Val Ala Glu Gly Gin Thr Leu Asp Leu Asn Cys Leu Val Ala Gly 
2450 2455 2460 

25 Gin Ala His Ala Gin Val Thr Trp His Lys Arg Gly Gly Ser Leu Pro 
2465 2470 2475 2480 

Ala Arg His Gin Val His Gly Ser Arg Leu Arg Leu Leu Gin Val Thr 
2485 2490 2495 

30 

Pro Ala Asp Ser Gly Glu Tyr Val Cys Arg Val Val Gly Ser Ser Gly 
2500 2505 2510 

Thr Gin Glu Ala Ser Val Leu Val Thr He Gin Gin Arg Leu Ser Gly 
35 2515 2520 2525 

Ser His Ser Gin Gly Val Ala Tyr Pro Val Arg He Glu Ser Ser Ser 
2530 2535 2540 

40 Ala Ser Leu Ala Asn Gly His Thr Leu Asp Leu Asn Cys Leu Val Ala 
2545 2550 2555 2560 

Ser Gin Ala Pro His Thr He Thr Trp Tyr Lys Arg Gly Gly Ser Leu 
2565 2570 2575 

45 

Pro Ser Arg His Gin He Val Gly Ser Arg Leu Arg He Pro Gin Val 
2580 2585 2590 

Thr Pro Ala Asp Ser Gly Glu Tyr Val Cys His Val Ser Asn Gly Ala 
50 2595 2600 2605 

Gly Ser Arg Glu Thr Ser Leu He Val Thr He Gin Gly Ser Gly Ser 
2610 2615 2620 

55 Ser His Val Pro Arg Val Ser Pro Pro He Arg He Glu Ser Ser Ser 
•2625 2630 2635 2640 

Pro Thr Val Val Glu Gly Gin Thr Leu Asp Leu Asn Cys Val Val Ala 
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2645 2650 2655 

Arg Gin Pro Gin Ala lie He Thr Trp Tyr Lys Arg Gly Gly Ser Leu 
2660 2665 2670 

5 

Pro Ser Arg His Gin Thr His Gly Ser His Leu Arg Leu His Gin Met 
2675 2680 2685 

Ser Val Ala Asp Ser Gly Glu Tyr Val Cys Arg Ala Asn Asn Asn He 
10 2690 2695 2700 

Asp Ala Leu Glu Ala Ser He Val He Ser Val Ser Pro Ser Ala Gly 
2705 2710 2715 2720 

15 Ser Pro Ser Ala Pro Gly Ser Ser Met Pro He Arg lie Glu Ser Ser 
2725 2730 2735 

Ser Ser His Val Ala Glu Gly Glu Thr Leu Asp Leu Asn Cys Val Val 
2740 2745 2750 

20 

Pro Gly Gin Ala His Ala Gin Val Thr Trp His Lys Arg Gly Gly Ser 
2755 2760 2765 

Leu Pro Ser Tyr His Gin Thr Arg Gly Ser Arg Leu Arg Leu His His 
25 2770 2775 2780 

Val Ser Pro Ala Asp Ser Gly Glu Tyr Val Cys Arg Val Met Gly Ser 
2785 2790 2795 2800 

30 Ser Gly Pro Leu Glu Ala Ser Val Leu Val Thr He Glu Ala Ser Gly 
2805 2810 2815 

Ser Ser Ala Val His Val Pro Ala Pro Gly Gly Ala Pro Pro He Arg 
2820 2825 2830 

35' 

He Glu Pro Ser Ser Ser Arg Val Ala Glu Gly Gin Thr Leu Asp Leu 
2835 2840 2845 

Lys Cys Val Val Pro Gly Gin Ala His Ala Gin Val Thr Trp His Lys 
40 2850 2855 2860 

Arg Gly Gly Asn Leu Pro Ala Arg His Gin Val His Gly Pro Leu Leu 
2865 2870 2875 2880 

45 Arg Leu Asn Gin Val Ser Pro Ala Asp Ser Gly Glu Tyr Ser Cys Gin 
2885 2890 2895 

Val Thr Gly Ser Ser Gly Thr Leu Glu Ala Ser Val Leu Val Thr He 
2900 2905 2910 

50 

Glu Pro Ser Ser Pro Gly Pro He Pro Ala Pro Gly Leu Ala Gin Pro 
2915 2920 2925 

He Tyr lie Glu Ala Ser Ser Ser His Val Thr Glu Gly Gin Thr Leu 
55 2930 2935 2940 



Asp Leu Asn Cys Val Val Pro Gly Gin Ala His Ala Gin Val Thr Trp 
2945 2950 2955 2960 
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Tyr Lys Arg Gly Gly Ser Leu Pro Ala Arg His Gin Thr His Gly Ser 
2965 2970 2975 

5 Gin Leu Arg Leu His His Val Ser Pro Ala Asp Ser Gly Glu Tyr Val 
2980 2985 2990 

Cys Arg Ala Ala Gly Gly Pro Gly Pro Glu Gin Glu Ala Ser Phe Thr 
2995 3000 3005 

10 

Val Thr Val Pro Pro Ser Glu Gly Ser Ser Tyr Arg Leu Arg Ser Pro 
3010 3015 3020 

Val lie Ser lie Asp Pro Pro Ser Ser Thr Val Gin Gin Gly Gin Asp 
15 3025 3030 3035 3040 

Ala Ser Phe Lys Cys Leu He His Asp Gly Ala Ala Pro He Ser Leu 
3045 3050 3055 

20 Glu Trp Lys Thr Arg Asn Gin Glu Leu Glu Asp Asn Val His He Ser 
3060 3065 3070 

Pro Asn Gly Ser He He Thr He Val Gly Thr Arg Pro Ser Asn His 
3075 3080 3085 

25 

Gly Thr Tyr Arg Cys Val Ala Ser Asn Ala Tyr Gly Val Ala Gin Ser 
3090 3095 3100 

Val Val Asn Leu Ser Val His Gly Pro Pro Thr Val Ser Val Leu Pro 
30 3105 3110 3115 3120 

Glu Gly Pro Val Trp Val Lys Val Gly Lys Ala Val Thr Leu Glu Cys 
3125 3130 3135 

35 Val Ser Ala Gly Glu Pro Arg Ser Ser Ala Arg Trp Thr Arg He Ser 
3140 3145 3150 

Ser Thr Pro Ala Lys Leu Glu Gin Arg Thr Tyr Gly Leu Met Asp Ser 
3155 3160 3165 

40 

His Thr Val Leu Gin He Ser Ser Ala Lys Pro Ser Asp Ala Gly Thr 
3170 3175 3180 

Tyr Val Cys Leu Ala Gin Asn Ala Leu Gly Thr Ala Gin Lys Gin Val 
45 3185 3190 3195 3200 

Glu Val He Val Asp Thr Gly Ala Met Ala Pro Gly Ala Pro Gin Val 
3205 3210 3215 

50 Gin Ala Glu Glu Ala Glu Leu Thr Val Glu Ala Gly His Thr Ala Thr 
3220 3225 3230 

Leu Arg Cys Ser Ala Thr Gly Ser Pro Ala Arg Thr He His Trp Ser 
3235 3240 3245 

55 

Lys Leu Arg Ser Pro Leu Pro Trp Gin His Arg Leu Glu Gly Asp Thr 
3250 3255 3260 
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Leu He He Pro Arg Val Ala Gin Gin Asp Ser Gly Gin Tyr He Cys 
3265 3270 3275 3280 

Asn Ala Thr Ser Pro Ala Gly His Ala Glu Ala Thr He He Leu His 
5 3285 3290 3295 

Val Glu Ser Pro Pro Tyr Ala Thr Thr Val Pro Glu His Ala Ser Val 
3300 3305 3310 

10 Gin Ala Gly Glu Thr Val Gin Leu Gin Cys Leu Ala His Gly Thr Pro 
3315 3320 3325 

Pro Leu Thr Phe Gin Trp Ser Arg Val Gly Ser Ser Leu Pro Gly Arg 
3330 3335 3340 

15 

Ala Thr Ala Arg Asn Glu Leu Leu His Phe Glu Arg Ala Ala Pro Glu 
3345 3350 3355 3360 

Asp Ser Gly Arg Tyr Arg Cys Arg Val Thr Asn Lys Val Gly Ser Ala 
20 3365 3370 3375 

Glu Ala Phe Ala Gin Leu Leu Val Gin Gly Pro Pro Gly Ser Leu Pro 
3380 3385 3390 

25 Ala Thr Ser He Pro Ala Gly Ser Thr Pro Thr Val Gin Val Thr Pro 
3395 3400 3405 

Gin Leu Glu Thr Lys Ser He Gly Ala Ser Val Glu Phe His Cys Ala 
3410 3415 3420 

30 

Val Pro Ser Asp Arg Gly Thr Gin Leu Arg Trp Phe Lys Glu Gly Gly 
3425 3430 3435 3440 

Gin Leu Pro Pro Gly His Ser Val Gin Asp Gly Val Leu Arg He Gin 
35 3445 3450 3455 

Asn Leu Asp Gin Ser Cys Gin Gly Thr Tyr He Cys Gin Ala His Gly 
3460 3465 3470 

40 Pro Trp Gly Lys Ala Gin Ala Ser Ala Gin Leu Val He Gin Ala Leu 
3475 3480 3485 

Pro Ser Val Leu He Asn He Arg Thr Ser Val Gin Thr Val Val Val 

3490 3495 3500 

45 

Gly His Ala Val Glu Phe Glu Cys Leu Ala Leu Gly Asp Pro Lys Pro 

3505 3510 3515 3520 

Gin Val Thr Trp Ser Lys Val Gly Gly His Leu Arg Pro Gly He Val 
50 3525 3530 3535 

Gin Ser Gly Gly Val Val Arg He Ala His Val Glu Leu Ala Asp Ala 
3540 3545 3550 

55 Gly Gin Tyr Arg Cys Thr Ala Thr Asn Ala Ala Gly Thr Thr Gin Ser 
3555 3560 3565 



His Val Leu Leu Leu Val 



Gin Ala Leu Pro Gin 



He Ser Met Pro Gin 
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3570 3575 3580 

Glu Val Arg Val Pro Ala Gly Ser Ala Ala Val Phe Pro Cys He Ala 
3585 3590 3595 3600 

5 

Ser Gly Tyr Pro Thr Pro Asp He Ser Trp Ser Lys Leu Asp Gly Ser 
3605 3610 3615 

Leu Pro Pro Asp Ser Arg Leu Glu Asn Asn Met Leu Met Leu Pro Ser 
10 3620 3625 3630 

Val Gin Pro Gin Asp Ala Gly Thr Tyr Val Cys Thr Ala Thr Asn Arg 
3635 3640 3645 

15 Gin Gly Lys Val Lys Ala Phe Ala His Leu Gin Val Pro Glu Arg Val 
3650 3655 3660 

Val Pro Tyr Phe Thr Gin Thr Pro Tyr Ser Phe Leu Pro Leu Pro Thr 
3665 3670 3675 3680 

20 

He Lys Asp Ala Tyr Arg Lys Phe Glu He Lys He Thr Phe Arg Pro 
3685 3690 3695 

Asp Ser Ala Asp Gly Met Leu Leu Tyr Asn Gly Gin Lys Arg Val Pro 
25 3700 3705 3710 

Gly Ser Pro Thr Asn Leu Ala Asn Arg Gin Pro Asp Phe He Ser Phe 
3715 3720 3725 

30 Gly Leu Val Gly Gly Arg Pro Glu Phe Arg Phe Asp Ala Gly Ser Gly 
3730 3735 3740 

Met Ala Thr He Arg His Pro Thr Pro Leu Ala Leu Gly His Phe His 
3745 3750 3755 3760 

35 

Thr Val Thr Leu Leu Arg Ser Leu Thr Gin Gly Ser Leu He Val Gly 
3765 3770 3775 

Asp Leu Ala Pro Val Asn Gly Thr Ser Gin Gly Lys Phe Gin Gly Leu 
40 3780 3785 3790 

Asp Leu Asn Glu Glu Leu Tyr Leu Gly Gly Tyr Pro Asp Tyr Gly Ala 
3795 3800 3805 

45 lie Pro Lys Ala Gly Leu Ser Ser Gly Phe He Gly Cys Val Arg Glu 
3810 3815 3820 

Leu Arg He Gin Gly Glu Glu He Val Phe His Asp Leu Asn Leu Thr 
3825 3830 3835 3840 

50 

Ala His Gly lie Ser His Cys Pro Thr Cys Arg Asp Arg Pro Cys Gin 
3845 3850 3855 

Asn Gly Gly Gin Cys His Asp Ser Glu Ser Ser Ser Tyr Val Cys Val 
55 3860 3865 3870 



Cys Pro Ala Gly Phe Thr Gly Ser Arg Cys Glu His Ser Gin Ala Leu 
3875 3880 3885 
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His Cys His Pro Glu Ala Cys Gly Pro Asp Ala Thr Cys Val Asn Arg 
3890 3895 3900 

5 Pro Asp Gly Arg Gly Tyr Thr Cys Arg Cys His Leu Gly Arg Ser Gly 
3905 3910 3915 3920 

Leu Arg Cys Glu Glu Gly Val Thr Val Thr Thr Pro Ser Leu Ser Gly 
3925 3930 3935 

10 

Ala Gly Ser Tyr Leu Ala Leu Pro Ala Leu Thr Asn Thr His His Glu 
3940 3945 3950 

Leu Arg Leu Asp Val Glu Phe Lys Pro Leu Ala Pro Asp Gly Val Leu 
15 3955 3960 3965 

Leu Phe Ser Gly Gly Lys Ser Gly Pro Val Glu Asp Phe Val Ser Leu 
3970 3975 3980 

20 Ala Met Val Gly Gly His Leu Glu Phe Arg Tyr Glu Leu Gly Ser Gly 
3985 3990 3995 4000 

Leu Ala Val Leu Arg Thr Ala Glu Pro Leu Ala Leu Gly Arg Trp His 
4005 4010 4015 

25 

Arg Val Ser Ala Glu Arg Leu Asn Lys Asp Gly Ser Leu Arg Val Asn 
4020 4025 4030 

Gly Gly Arg Pro Val Leu Arg Ser Ser Pro Gly Lys Ser Gin Gly Leu 
30 4035 4040 4045 

Asn Leu His Thr Leu Leu Tyr Leu Gly Gly Val Glu Pro Ser Val Pro 
4050 4055 4060 

35 Leu Ser Pro Ala Thr Asn Met Ser Ala His Phe Arg Gly Cys Val Gly 
4065 4070 4075 4080 

Glu Val Ser Val Asn Gly Lys Arg Leu Asp Leu Thr Tyr Ser Phe Leu 
4085 4090 4095 

40 

Gly Ser Gin Gly lie Gly Gin Cys Tyr Asp Ser Ser Pro Cys Glu Arg 
4100 4105 4110 

Gin Pro Cys Gin His Gly Ala Thr Cys Met Pro Ala Gly Glu Tyr Glu 
45 4115 4120 4125 

Phe Gin Cys Leu Cys Arg Asp Gly lie Lys Gly Asp Leu Cys Glu His 
4130 4135 4140 

50 Glu Glu Asn Pro Cys Gin Leu Arg Glu Pro Cys Leu His Gly Gly Thr 
4145 4150 4155 4160 

Cys Gin Gly Thr Arg Cys Leu Cys Leu Pro Gly Phe Ser Gly Pro Arg 
4165 4170 4175 

55 

Cys Gin Gin Gly Ser Gly His Gly lie Ala Glu Ser Asp Trp His Leu 
4180 4185 4190 
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Glu Gly Ser Gly Gly Asn Asp Ala Pro Gly Gin Tyr Gly Ala Tyr Phe 
4195 4200 4205 

His Asp Asp Gly Phe Leu Ala Phe Pro Gly His Val Phe Ser Arg Ser 
5 4210 4215 4220 

Leu Pro Glu Val Pro Glu Thr lie Glu Leu Glu Val Arg Thr Ser Thr 
4225 4230 4235 4240 

10 Ala Ser Gly Leu Leu Leu Trp Gin Gly Val Glu Val Gly Glu Ala Gly 
4245 4250 4255 

Gin Gly Lys Asp Phe He Ser Leu Gly Leu Gin Asp Gly His Leu Val 
4260 4265 4270 

15 

Phe Arg Tyr Gin Leu Gly Ser Gly Glu Ala Arg Leu Val Ser Glu Asp 
4275 4280 4285 

Pro He Asn Asp Gly Glu Trp His Arg Val Thr Ala Leu Arg Glu Gly 
20 4290 4295 4300 

Arg Arg Gly Ser He Gin Val Asp Gly Glu Glu Leu Val Ser Gly Arg 
4305 4310 4315 4320 

25 Ser Pro Gly Pro Asn Val Ala Val Asn Ala Lys Gly Ser He Tyr He 
4325 4330 4335 

Gly Gly Ala Pro Asp Val Ala Thr Leu Thr Gly Gly Arg Phe Ser Ser 
4340 4345 4350 

30 

Gly He Thr Gly Cys Val Lys Asn Leu Val Leu His Ser Ala Arg Pro 
4355 4360 4365 

Gly Ala Pro Pro Pro Gin Pro Leu Asp Leu Gin His Arg Ala Gin Ala 
35 4370 4375 4380 

Gly Ala Asn Thr Arg Pro Cys Pro Ser 
4385 4390 

40 

<210> 2 

<211> 195 

<212> PRT 

45 <213> Homo sapiens 

<400> 2 

Asp Ala Pro Gly Gin Tyr Gly Ala Tyr Phe His Asp Asp Gly Phe Leu 
15 10 15 

50 

Ala Phe Pro Gly His Val Phe Ser Arg Ser Leu Pro Glu Val Pro Glu 
20 25 30 

Thr He Glu Leu Glu Val Arg Thr Ser Thr Ala Ser Gly Leu Leu Leu 
55 35 40 45 



Trp Gin Gly Val Glu Val Gly Glu Ala Gly Gin 
50 55 



Gly Lys Asp Phe He 
60 



WO 01/05422 



16 



PCT/FROO/02057 



Ser Leu Gly Leu Gin Asp Gly His Leu Val Phe Arg Tyr Gin Leu Gly 
65 70 75 80 

5 Ser Gly Glu Ala Arg Leu Val Ser Glu Asp Pro lie Asn Asp Gly Glu 

85 90 95 

Trp His Arg Val Thr Ala Leu Arg Glu Gly Arg Arg Gly Ser lie Gin 
100 105 110 



10 



Val Asp Gly Glu Glu Leu Val Ser Gly Arg Ser Pro Gly Pro Asn Val 
115 120 125 



Ala Val Asn Ala Lys Gly Ser Val Tyr He Gly Gly Ala Pro Asp Val 
15 130 135 140 

Ala Thr Leu Thr Gly Gly Arg Phe Ser Ser Gly He Thr Gly Cys Val 
145 150 155 160 

20 Lys Asn Leu Val Leu His Ser Ala Arg Pro Gly Ala Pro Pro Pro Gin 

165 170 175 



25 



Pro Leu Asp Leu Gin His Arg Ala Gin Ala Gly Ala Asn Thr Arg Pro 
180 185 190 

Cys Pro Ser 
195 



30 

<210> 3 
<211> 508 
<212> PRT 

<213> Homo sapiens 

35 

<400> 3 

Arg Thr Cys Arg Cys Lys Asn Asn Val Val Gly Arg Leu Cys Asn Glu 
15 10 15 

40 Cys Ala Asp Arg Ser Phe His Leu Ser Thr Arg Asn Pro Asp Gly Cys 
20 25 30 

Leu Lys Cys Phe Cys Met Gly Val Ser Arg His Cys Thr Ser Ser Ser 
35 40 45 

45 

Trp Ser Arg Ala Gin Leu His Gly Ala Ser Glu Glu Pro Gly His Phe 
50 55 60 

Ser Leu Thr Asn Ala Ala Ser Thr His Thr Thr Asn Glu Gly He Phe 
50 65 70 75 80 

Ser Pro Thr Pro Gly Glu Leu Gly Phe Ser Ser Phe His Arg Leu Leu 
85 90 95 

55 Ser Gly Pro Tyr Phe Trp Ser Leu Pro Ser Arg Phe Leu Gly Asp Lys 
100 105 110 

Val Thr Ser Tyr Gly Gly Glu Leu Arg Phe Thr Val Thr Gin Arg Ser 
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115 120 125 

Gin Pro Gly Ser Thr Pro Leu His Gly Gin Pro Leu Val Val Leu Gin 
130 135 140 

5 

Gly Asn Asn lie He Leu Glu His His Val Ala Gin Glu Pro Ser Pro 
145 150 155 160 

Gly Gin Pro Ser Thr Phe He Val Pro Phe Arg Glu Gin Ala Trp Gin 
10 165 170 175 

Arg Pro Asp Gly Gin Pro Ala Thr Arg Glu His Leu Leu Met Ala Leu 
180 185 190 

15 Ala Gly He Asp Thr Leu Leu He Arg Ala Ser Tyr Ala Gin Gin Pro 
195 200 205 

Ala Glu Ser Arg Leu Ser Gly He Ser Met Asp Val Ala Val Pro Glu 
210 215 220 

20 

Glu Thr Gly Gin Asp Pro Ala Leu Glu Val Glu Gin Cys Ser Cys Pro 
225 230 235 240 

Pro Gly Tyr Leu Gly Pro Ser Cys Gin Asp Cys Asp Thr Gly Tyr Thr 
25 245 250 255 

Arg Thr Pro Ser Gly Leu Tyr Leu Gly Thr Cys Glu Arg Cys Ser Cys 
260 265 270 

30 His Gly His Ser Glu Ala Cys Glu Pro Glu Thr Gly Ala Cys Gin Gly 
275 280 285 

Cys Gin His His Thr Glu Gly Pro Arg Cys Glu Gin Cys Gin Pro Gly 
290 295 300 

35 

Tyr Tyr Gly Asp Ala Gin Arg Gly Thr Pro Gin Asp Cys Gin Leu Cys 
305 310 315 320 

Pro Cys Tyr Gly Asp Pro Ala Ala Gly Gin Ala Ala Leu Thr Cys Phe 
40 325 330 335 

Leu Asp Thr Asp Gly His Pro Thr Cys Asp Ala Cys Ser Pro Gly His 
340 345 350 

45 Ser Gly Arg His Cys Glu Arg Cys Ala Pro Gly Tyr Tyr Gly Asn Pro 
355 360 365 

Ser Gin Gly Gin Pro Cys Gin Arg Asp Ser Gin Val Pro Gly Pro He 
370 375 380 

50 

Gly Cys Asn Cys Asp Pro Gin Gly Ser Val Ser Ser Gin Cys Asp Ala 
385 390 395 400 

Ala Gly Gin Cys Gin Cys Lys Ala Gin Val Glu Gly Leu Thr Cys Ser 
55 405 410 415 

His Cys Arg Pro His His Phe His Leu Ser Ala Ser Asn Pro Asp Gly 
420 425 430 
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Cys Leu Pro Cys Phe 
435 

5 Ala Tyr Thr Arg His 
450 

Gin Gly Phe Ala Leu 
465 

10 

Glu Phe Thr Val Glu 
485 

Asn Phe Ala Gin Leu 
15 500 



Cys Met Gly He Thr 
440 

Leu He Ser Thr His 
455 

Val Asn Pro Gin Arg 
470 

Pro Val Pro Glu Gly 
490 

Gly His Glu Ser Phe 
505 



Gin Gin Cys Ala Ser Ser 
445 

Phe Ala Pro Gly Asp Phe 
460 

Asn Ser Arg Leu Thr Gly 
475 480 

Ala Gin Leu Ser Phe Gly 
495 

Tyr Trp 



<210> 4 
20 <211> 199 
<212> PRT 

<213> Homo sapiens 
<400> 4 

25 Met Lys Trp Val Trp Ala Leu Leu Leu Leu Ala Ala Trp Ala Ala Ala 
15 10 15 

Glu Arg Asp Cys Arg Val Ser Ser Phe Arg Val Lys Glu Asn Phe Asp 
20 25 30 

30 

Lys Ala Arg Phe Ser Gly Thr Trp Tyr Ala Met Ala Lys Lys Asp Pro 
35 40 45 

Glu Gly Leu Phe Leu Gin Asp Asn He Val Ala Glu Phe Ser Val Asp 
35 50 55 60 

Glu Thr Gly Gin Met Ser Ala Thr Ala Lys Gly Arg Val Arg Leu Leu 
65 70 75 80 

40 Asn Asn Trp Asp Val Cys Ala Asp Met Val Gly Thr Phe Thr Asp Thr 

85 90 95 

Glu Asp Pro Ala Lys Phe Lys Met Lys Tyr Trp Gly Val Ala Ser Phe 
100 105 110 

45 

Leu Gin Lys Gly Asn Asp Asp His Trp He Val Asp Thr Asp Tyr Asp 
115 120 125 

Thr Tyr Ala Val Gin Tyr Ser Cys Arg Leu Leu Asn Leu Asp Gly Thr 
50 130 135 140 

Cys Ala Asp Ser Tyr Ser Phe Val Phe Ser Arg Asp Pro Asn Gly Leu 
145 150 155 160 

55 Pro Pro Glu Ala Gin Lys He Val Arg Gin Arg Gin Glu Glu Leu Cys 

165 170 175 



Leu Ala 



Arg Gin Tyr Arg Leu He Val His Asn Gly Tyr Cys Asp Gly 
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180 185 190 



Arg Ser Glu Arg Asn Leu Leu 
195 

5 



<210> 5 
<211> 199 
10 <212> PRT 

<213> Homo sapiens 

<400> 5 

Met Lys Trp Val Trp Ala Leu Leu Leu Leu Ala Ala Trp Ala Ala Ala 
15 1 5 10 15 

Glu Arg Asp Cys Arg Val Ser Ser Phe Arg Val Lys Glu Asn Phe Asp 
20 25 30 

20 Lys Ala Arg Phe Ser Gly Thr Trp Tyr Ala Met Ala Lys Lys Asp Pro 
35 40 45 

Glu Gly Leu Phe Leu Gin Asp Asn lie Val Ala Glu Phe Ser Val Asp 
50 55 60 

25 

Glu Thr Gly Gin Met Ser Ala Thr Ala Lys Gly Arg Val Arg Leu Leu 
65 70 75 80 

Asn Asn Trp Asp Val Cys Ala Asp Met Val Gly Thr Phe Thr Asp Thr 
30 85 90 95 

Glu Asp Pro Ala Lys Phe Lys Met Lys Tyr Trp Gly Val Ala Ser Phe 
100 105 110 

35 Leu Gin Lys Gly Asn Asp Asp His Trp He Val Asp Thr Asp Tyr Asp 
115 120 125 

Thr Tyr Ala Val Gin Tyr Ser Cys Arg Leu Leu Asn Leu Asp Gly Thr 
130 135 140 

40 

Cys Ala Asp Ser Tyr Ser Phe Val Phe Ser Arg Asp Pro Asn Gly Leu 
145 150 155 160 

Pro Pro Glu Ala Gin Lys He Val Arg Gin Arg Gin Glu Glu Leu Cys 
45 165 170 175 

Leu Ala Arg Gin Tyr Arg Leu He Val His Asn Gly Tyr Cys Asp Gly 
180 185 190 

50 Arg Ser Glu Arg Asn Leu Leu 
195 



55 <210> 6 

<211> 199 
<212> PRT 
<213> Homo sapiens 
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<400> 6 

Met Lys Trp Val Trp Ala Leu Leu Leu Leu Ala Ala Trp Ala Ala Ala 
15 10 15 

Glu Arg Asp Cys Arg Val Ser Ser Phe Arg Val Lys Glu Asn Phe Asp 
20 25 30 

Lys Ala Arg Phe Ser Gly Thr Trp Tyr Ala Met Ala Lys Lys Asp Pro 
35 40 45 

Glu Gly Leu Phe Leu Gin Asp Asn lie Val Ala Glu Phe Ser Val Asp 
50 55 60 

Glu Thr Gly Gin Met Ser Ala Thr Ala Lys Gly Arg Val Arg Leu Leu 
65 70 75 80 

Asn Asn Trp Asp Val Cys Ala Asp Met Val Gly Thr Phe Thr Asp Thr 
85 90 95 

Glu Asp Pro Ala Lys Phe Lys Met Lys Tyr Trp Gly Val Ala Ser Phe 
100 105 110 

Leu Gin Lys Gly Asn Asp Asp His Trp He Val Asp Thr Asp Tyr Asp 
115 120 125 

Thr Tyr Ala Val Gin Tyr Ser Cys Arg Leu Leu Asn Leu Asp Gly Thr „' 
130 135 140 

Cys Ala Asp Ser Tyr Ser Phe Val Phe Ser Arg Asp Pro Asn Gly Leu 
145 150 155 160 

Pro Pro Glu Ala Gin Lys He Val Arg Gin Arg Gin Glu Glu Leu Cys 
165 170 175 

Leu Ala Arg Gin Tyr Arg Leu He Val His Asn Gly Tyr Cys Asp Gly 
180 185 190 

Arg Ser Glu Arg Asn Leu Leu 
195 



<210> 7 
<211> 182 
<212> PRT 

<213> Homo sapiens 
<400> 7 

Glu Arg Asp Cys Arg Val Ser Ser Phe Arg Val Lys Glu Asn Phe Asp 
1 5 10 15 

Lys Ala Arg Phe Ser Gly Thr Trp Tyr Ala Met Ala Lys Lys Asp Pro 
20 25 30 



Glu Gly Leu Phe Leu Gin Asp Asn He Val Ala Glu Phe Ser Val Asp 
35 40 45 
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Glu Thr Gly Gin Met Ser Ala Thr Ala Lys Gly Arg Val Arg Leu Leu 
50 55 60 

Asn Asn Trp Asp Val Cys Ala Asp Met Val Gly Thr Phe Thr Asp Thr 
5 65 70 75 80 

Glu Asp Pro Ala Lys Phe Lys Met Lys Tyr Trp Gly Val Ala Ser Phe 
85 90 95 

10 Leu Gin Lys Gly Asn Asp Asp His Trp lie Val Asp Thr Asp Tyr Asp 
100 105 110 



15 



Thr Tyr Ala Val Gin Tyr Ser Cys Arg Leu Leu Asn Leu Asp Gly Thr 

115 120 125 

Cys Ala Asp Ser Tyr Ser Phe Val Phe Ser Arg Asp Pro Asn Gly Leu 

130 135 140 



Pro Pro Glu Ala Gin Lys lie Val Arg Gin Arg Gin Glu Glu Leu Cys 

20 145 150 155 160 

Leu Ala Arg Gin Tyr Arg Leu lie Val His Asn Gly Tyr Cys Asp Gly 

165 170 175 



25 Arg Ser Glu Arg Asn Leu 
180 



30 <210> 8 

<211> 193 
<212> PRT 

<213> Homo sapiens 
35 <400> 8 

Met Gin Ser Leu Met Gin Ala Pro Leu Leu lie Ala Leu Gly Leu Leu 
15 10 15 

Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser 
40 20 25 30 

Ser Phe Ser Trp Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala Val lie 
35 40 45 

45 Arg Ser Leu Thr Leu Glu Pro Asp Pro lie Val Val Pro Gly Asn Val 
50 55 60 

Thr Leu Ser Val Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro Leu 
65 70 75 80 

50 

Lys Val Asp Leu Val Leu Glu Lys Glu Val Ala Gly Leu Trp lie Lys 
85 90 95 

lie Pro Cys Thr Asp Tyr lie Gly Ser Cys Thr Phe Glu His Phe Cys 
55 100 105 110 



Asp Val Leu Asp Met Leu lie Pro Thr Gly Glu Pro Cys Pro Glu Pro 
115 120 125 
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Leu Arg Thr Tyr Gly Leu Pro Cys His Cys Pro Phe Lys Glu Gly Thr 
130 X35 140 

5 Tyr Ser Leu Pro Lys Ser Glu Phe Val Val Pro Asp Leu Glu Leu Pro 
145 150 155 160 

Ser Trp Leu Thr Thr Gly Asn Tyr Arg lie Glu Ser Val Leu Ser Ser 
165 170 175 



10 



Ser Gly Lys Arg Leu Gly Cys lie Lys lie Ala Ala Ser Leu Lys Gly 
180 185 190 



He 



15 



<210> 9 
20 <211> 193 
<212> PRT 

<213> Homo sapiens 
<400> 9 

25 Met Gin Ser Leu Met Gin Ala Pro Leu Leu lie Ala Leu Gly Leu Leu 
15 10 15 

Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser 
20 25 30 

30 

Ser Phe Ser Trp Asp Asn Cys Phe Glu Gly Lys Asp Pro Ala Val He 
35 40 45 

Arg Ser Leu Thr Leu Glu Pro Asp Pro He Val Val Pro Gly Asn Val 
35 50 55 60 

Thr Leu Ser Val Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro Leu 
65 70 75 80 

40 Lys Val Asp Leu Val Leu Glu Lys Glu Val Ala Gly Leu Trp He Lys 

85 90 95 

He Pro Cys Thr Asp Tyr He Gly Ser Cys Thr Phe Glu His Phe Cys 
100 105 110 

45 

Asp Val Leu Asp Met Leu He Pro Thr Gly Glu Pro Cys Pro Glu Pro 
115 120 125 

Leu Arg Thr Tyr Gly Leu Pro Cys His Cys Pro Phe Lys Glu Gly Thr 
50 130 135 140 

Tyr Ser Leu Pro Lys Ser Glu Phe Ala Val Pro Asp Leu Glu Leu Pro 
145 150 155 160 

55 Ser Trp Leu Thr Thr Gly Asn Tyr Arg He Glu Ser Val Leu Ser Ser 

165 170 175 



Ser Gly Lys Arg Leu Gly Cys He Lys He Ala Ala Ser Leu Lys Gly 
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180 



185 



190 



lie 



<210> 10 

<211> 178 

10 <212> PRT 

<213> Homo sapiens 

<400> 10 

Leu Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu 
15 1 5 10 15 

Ser Ser Phe Ser Trp Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala Val 
20 25 30 

20 He Arg Ser Leu Thr Leu Glu Pro Asp Pro He Val Val Pro Gly Asn 
35 40 45 

Val Thr Leu Ser Val Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro 
50 55 60 

25 

Leu Lys Val Asp Leu Val Leu Glu Lys Glu Val Ala Gly Leu Trp He 
65 70 75 80 

Lys He Pro Cys Thr Asp Tyr He Gly Ser Cys Thr Phe Glu His Phe 
30 85 90 95 

Cys Asp Val Leu Asp Met Leu He Pro Thr Gly Glu Pro Cys Pro Glu 
100 105 110 

35 Pro Leu Arg Thr Tyr Gly Leu Pro Cys His Cys Pro Phe Lys Glu Gly 
115 120 125 

Thr Tyr Ser Leu Pro Lys Ser Glu Phe Val Val Pro Asp Leu Glu Leu 
130 135 140 

40 

Pro Ser Trp Leu Thr Thr Gly Asn Tyr Arg He Glu Ser Val Leu Ser 
145 150 155 160 

Ser Ser Gly Lys Arg Leu Gly Cys He Lys He Ala Ala Ser Leu Lys 
45 165 170 175 

Gly He 



50 

<210> 11 
<211> 200 
<212> PRT 
55 <213> Homo sapiens 



<400> 11 

Arg Ala Gly Pro Pro Phe Pro Met Gin Ser Leu Met Gin Ala Pro Leu 
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10 



15 



Leu He Ala Leu Gly Leu Leu Leu Ala Ala Pro Ala Gin Ala His Leu 
20 25 30 

5 

Lys Lys Pro Ser Gin Leu Ser Ser Phe Ser Trp Asp Asn Cys Asp Glu 
35 40 45 

Gly Lys Asp Pro Ala Val He Arg Ser Leu Thr Leu Glu Pro Asp Pro 
10 50 55 60 

He He Val Pro Gly Asn Val Thr Leu Ser Val Met Gly Ser Thr Ser 
65 70 75 80 

15 Val Pro Leu Ser Ser Pro Leu Lys Val Asp Leu Val Leu Glu Lys Glu 

85 90 95 



20 



Val Ala Gly Leu Trp He Lys He Pro Cys Thr Asp Tyr He Gly Ser 
100 105 110 

Cys Thr Phe Glu His Phe Cys Asp Val Leu Asp Met Leu He Pro Thr 
115 120 125 



Gly Glu Pro Cys Pro Glu Pro Leu Arg Thr Tyr Gly Leu Pro Cys His 
25 130 135 140 

Cys Pro Phe Lys Glu Gly Thr Tyr Ser Leu Pro Lys Ser Glu Phe Val 
145 150 155 160 

30 Val Pro Asp Leu Glu Leu Pro Ser Trp Leu Thr Thr Gly Asn Tyr Arg 
165 170 175 



35 



He Glu Ser Val Leu Ser Ser Ser Gly Lys Arg Leu Gly Cys He Lys 
180 185 190 

He Ala Ala Ser Leu Lys Gly He 

195 200 



45 



40 

<210> 12 
<211> 189 
<212> PRT 

<213> Homo sapiens 
<400> 12 

Met Gin Ala Pro Leu Leu He Ala Leu Gly Leu Leu Leu Ala Thr Pro 
15 10 15 

50 Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser Ser Phe Ser Trp 
20 25 30 



55 



Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala Val He Arg Ser Leu Thr 

35 40 45 

Leu Glu Pro Asp Pro He Val Val Pro Gly Asn Val Thr Leu Ser Val 

50 55 60 



WO 01/05422 PCT7FR00/02057 

25 



Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro Leu Lys Val Asp Leu 
65 70 75 80 

Val Leu Glu Lys Glu Val Ala Gly Leu Trp lie Lys lie Pro Cys Thr 
5 85 90 95 

Asp Tyr lie Gly Ser Cys Thr Phe Glu His Phe Cys Asp Val Leu Asp 
100 105 110 

10 Met Leu He Pro Thr Gly Glu Pro Cys Pro Glu Pro Leu Arg Thr Tyr 
115 120 125 

Gly Leu Pro Cys His Cys Pro Phe Lys Glu Gly Thr Tyr Ser Leu Pro 
130 135 140 

15 

Lys Ser Glu Phe Val Val Pro Asp Leu Glu Leu Pro Ser Trp Leu Thr 
145 150 155 160 

Thr Gly Asn Tyr Arg He Glu Ser Val Leu Ser Ser Ser Gly Lys Arg 
20 165 170 175 

Leu Gly Cys He Lys He Ala Ala Ser Leu Lys Gly He 
180 185 

25 

• <210> 13 
<211> 193 
<212> PRT 
30 <213> Homo sapiens 

<400> 13 

Met Gin Ser Leu Met Gin Ala Pro Leu Leu He Ala Leu Gly Leu Leu 
15 10 15 

35 

Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser 
20 25 30 

Ser Phe Ser Trp Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala Val He 
40 35 40 45 

Arg Ser Leu Thr Leu Glu Pro Asp Pro He Val Val Pro Gly Asn Val 
50 55 60 

45 Thr Leu Ser Val Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro Leu 
65 70 75 80 

Lys Val Asp Leu Val Leu Glu Lys Glu Val Ala Gly Leu Trp He Lys 
85 90 95 

50 

He Pro Cys Thr Asp Tyr He Gly Ser Cys Thr Phe Glu His Phe Cys 
100 105 110 

Asp Val Leu Asp Met Leu He Pro Thr Gly Glu Pro Cys Pro Glu Pro 
55 115 120 125 



Leu Arg Thr Tyr Gly Leu Pro Cys His Cys Pro Phe Lys Glu Gly Thr 
130 135 140 
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Tyr Ser Leu Pro Lys Ser Glu Phe Val Val Pro Asp Leu Glu Leu Pro 

145 150 155 160 

5 Ser Trp Leu Thr Thr Gly Asn Tyr Arg lie Glu Ser Val Leu Ser Ser 

165 170 175 



10 



Ser Gly Lys Arg Leu Gly Cys He Lys He Ala Ala Ser Leu Lys Gly 
180 185 190 

He 



15 

<210> 14 
<211> 193 
<212> PRT 

<213> Homo sapiens 

20 

<400> 14 

Met Gin Ser Leu Met Gin Ala Pro Leu Leu He Ala Leu Gly Leu Leu 
15 10 15 

25 Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser 
20 25 30 

Ser Phe Ser Trp Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala. Val lie 
35 * 40 45 

30 

Arg Ser Leu Thr Leu Glu Pro Asp Pro He Val Val Pro Gly Asn Val 
50 55 60 

Thr Leu Ser Val Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro Leu 
35 65 70 75 80 

Lys Val Asp Leu Val Leu Glu Lys Glu Val Ala Gly Leu Trp He Lys 
85 90 95 

40 He Pro Cys Thr Asp Tyr He Gly Ser Cys Thr Phe Glu His Phe Cys 
100 105 110 

Asp Val Leu Asp Met Leu He Pro Thr Gly Glu Pro Cys Pro Glu Pro 
115 120 125 

45 

Leu Arg Thr Tyr Gly Leu Pro Cys His Cys Pro Phe Lys Glu Gly Thr 
130 135 140 

Tyr Ser Leu Pro Lys Ser Glu Phe Val Val Pro Asp Leu Glu Leu Pro 
50 145 150 155 160 

Ser Trp Leu Thr Thr Gly Asn Tyr Arg He Glu Ser Val Leu Ser Ser 
165 170 175 

55 Ser Gly Lys Arg Leu Gly Cys He Lys He Ala Ala Ser Leu Lys Gly 
180 185 190 

He 



WO 01/05422 



27 



PCT/FROO/02057 



5 <210> 15 
<211> 193 
<212> PRT 
<213> Homo sapiens 

10 <400> 15 

Met Gin Ser Leu Met Gin Ala Pro Leu Leu lie Ala Leu Gly Leu Leu 
15 10 15 

Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser 
15 20 25 30 

Ser Phe Ser Trp Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala Val lie 
35 40 45 

20 Arg Ser Leu Thr Leu Glu Pro Asp Pro He Val Val Pro Gly Asn Val 
50 55 60 

Thr Leu Ser Val Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro Leu 
65 70 75 80 

25 

Lys Val Asp Leu Val Leu Glu Lys Glu Val Ala Gly Leu Trp He Lys 
85 90 95 

He Pro Cys Thr Asp Tyr He Gly Ser Cys Thr Phe Glu His Phe Cys 
30 100 105 110 

Asp Val Leu Asp Met Leu He Pro Thr Gly Glu Pro Cys Pro Glu Pro 
115 120 125 

35 Leu Arg Thr Tyr Gly Leu Pro Cys His Cys Pro Phe Lys Glu Gly Thr 
130 135 140 

Tyr Ser Leu Pro Lys Ser Glu Phe Val Val Pro Asp Leu Glu Leu Pro 
145 150 155 160 

40 

Ser Trp Leu Thr Thr Gly Asn Tyr Arg He Glu Ser Val Leu Ser Ser 
165 170 175 

Ser Gly Lys Arg Leu Gly Cys He Lys He Ala Ala Ser Leu Lys Gly 
45 180 185 190 

He 



50 

<210> 16 

<211> 193 

<212> PRT 

55 <213> Homo sapiens 

<400> 16 

Met Gin Ser Leu Met Gin Ala Pro Leu Leu He Ala Leu Gly Leu Leu 
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10 



15 



Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser 
20 25 30 

5 

Ser Phe Ser Trp Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala Val lie 
35 40 45 

Arg Ser Leu Thr Leu Glu Pro Asp Pro lie Val Val Pro Gly Asn Val 
10 50 55 60 

Thr Leu Ser Val Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro Leu 
65 70 75 80 

15 Lys Val Asp Leu Val Leu Glu Lys Glu Val Ala Gly Leu Trp lie Lys 

85 90 95 

lie Pro Cys Thr Asp Tyr lie Gly Ser Cys Thr Phe Glu His Phe Cys 
100 105 110 



20 



Asp Val Leu Asp Met Leu lie Pro Thr Gly Glu Pro Cys Pro Glu Pro 
115 120 125 



Leu Arg Thr Tyr Gly Leu Pro Cys His Cys Pro Phe Lys Glu Gly Thr 
25 130 135 140 

Tyr Ser Leu Pro Lys Ser Glu Phe Val Val Pro Asp Leu Glu Leu Pro 

145 150 155 160 

30 Ser Trp Leu Thr Thr Gly Asn Tyr Arg lie Glu Ser Val Leu Ser Ser 

165 170 175 



35 



Ser Gly Lys Arg Leu Gly Cys lie Lys lie Ala Ala Ser Leu Lys Gly 
180 185 190 

He 



40 

<210> 17 
<211> 114 
<212> PRT 

<213> Homo sapiens 

45 

<400> 17 

Met Thr Cys Lys Met Ser Gin Leu 
1 5 

50 Asn Thr Phe His Gin Tyr Ser Val 
20 

Asn Gin Gly Glu Phe Lys Glu Leu 
35 40 

55 

Leu Lys Lys Glu Asn Lys Asn Glu 
50 55 



Glu Arg Asn He Glu Thr He He 
10 15 

Lys Leu Gly His Pro Asp Thr Leu 
25 30 

Val Arg Lys Asp Leu Gin Asn Phe 
45 

Lys Val He Glu His He Met Glu 
60 
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Asp Leu Asp Thr Asn Ala Asp Lys Gin Leu Ser Phe Glu Glu Phe lie 
65 70 75 80 

Met Leu Met Ala Arg Leu Thr Trp Ala Ser His Glu Lys Met His Glu 
5 85 90 95 

Gly Asp Glu Gly Pro Gly His His His Lys Pro Gly Leu Gly Glu Gly 
100 105 110 

10 Thr Pro 



15 <210> 18 
<211> 93 
<212> PRT 

<213> Homo sapiens 
20 <400> 18 

Met Leu Thr Glu Leu Glu Lys Ala Leu Asn Ser He He Asp Val Tyr 
15 10 15 

His Lys Tyr Ser Leu He Lys Gly Asn Phe His Ala Val Tyr Arg Asp 
25 20 25 30 

Asp Leu Lys" Lys Leu Leu Glu Thr Glu Cys Pro Gin Tyr He Arg Lys 
35 40 45 

30 Lys Gly Ala Asp Val Trp Phe Lys Glu Leu Asp He Asn Thr Asp Gly 
50 55 60 

Ala Val Asn Phe Gin Glu Phe Leu He Leu Val He Lys Met Gly Val 
65 70 75 80 

35 

Ala Ala His Lys Lys Ser His Glu Glu Ser His Lys Glu 
85 90 



40 

<210> 19 

<211> 92 

<212> PRT 

<213> Homo sapiens 

45 

<400> 19 

Met Thr Lys Leu Glu Glu His 
1 5 

50 Gin Tyr Ser Val Arg Lys Gly 
20 

Leu Lys Gin Leu Leu Thr Lys 
35 

55 

Lys Asp Lys Ala Val lie Asp 
50 55 



Leu Glu Gly He Val Asn He Phe His 
10 15 

His Phe Asp Thr Leu Ser Lys Gly Glu 
25 30 

Glu Leu Ala Asn Thr He Lys Asn He 
40 45 

Glu He Phe Gin Gly Leu Asp Ala Asn 
60 
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Gin Asp Glu Gin Val Asp Phe Gin Glu Phe lie Ser Leu Val Ala lie 
65 70 75 80 



Ala Leu Lys Ala Ala His Tyr His Thr His Lys Glu 
85 90 



<210> 20 

<211> 92 

<212> PRT 

<213> Homo sapiens 

<400> 20 

Met Thr Lys Leu Glu Glu His Leu Glu Gly He Val Asn He Phe His 
15 10 15 

Gin Tyr Ser Val Arg Lys Gly His Phe Asp Thr Leu Ser Lys Gly Glu 
20 25 30 

Leu Lys Gin Leu Leu Thr Lys Glu Leu Ala Asn Thr He Lys Asn He 
35 40 45 

Lys Asp Lys Ala Val He Asp Glu He Phe Gin Gly Leu Asp Ala Asn 
50 55 60 

Gin Asp Glu Gin Val Asp Phe Gin Glu Phe He Ser Leu Val Ala He 
65 70 75 80 

Ala Leu Lys Ala Ala His Tyr His Thr His Lys Glu 
85 90 



<210> 21 

<211> 91 

<212> PRT 

<213> Homo sapiens 

<400> 21 

Thr Lys Leu Glu Glu His Leu Glu Gly He Val Asn He Phe His Gin 
1 5 10 15 

Tyr Ser Val Arg Lys Gly His Phe Asp Thr Leu Ser Lys Gly Glu Leu 
20 25 30 

Lys Gin Leu Leu Thr Lys Glu Leu Ala Asn Thr He Lys Asn He Lys 
35 40 45 

Asp Lys Ala Val He Asp Glu He Phe Gin Gly Leu Asp Ala Asn Gin 
50 55 60 

Asp Glu Gin Val Asp Phe Gin Glu Phe He Ser Leu Val Ala He Ala 
65 70 75 80 

Leu Lys Ala Ala His Tyr His Thr His Lys Glu 
85 90 
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<210> 22 

<211> 93 

5 <212> PRT 

<213> Homo sapiens 

<400> 22 

Met Leu Thr Glu Leu Glu Lys Ala Leu Asn Ser lie lie Asp Val Tyr 
10 1 5 10 15 

His Lys Tyr Ser Leu lie Lys Gly Asn Phe His Ala Val Tyr Arg Asp 
20 25 30 

15 Asp Leu Lys Lys Leu Leu Glu Thr Glu Cys Pro Gin Tyr lie Arg Lys 
35 40 45 

Lys Gly Ala Asp Val Trp Phe Lys Glu Leu Asp lie Asn Thr Asp Gly 
50 55 60 

20 

Ala Val Asn Phe Gin Glu Phe Leu He Leu Val He Lys Met Gly Val 
65 70 75 80 

Ala Ala His Lys Lys Ser His Glu Glu Ser His Lys Glu 
25 85 90 



<210> 23 

30 <211> 92 

<212> PRT 

<213> Homo sapiens 

<400> 23 

35 Met Thr Lys Leu Glu Glu His Leu Glu Gly He Val Asn He Phe His 
1 5 10 15 

Gin Tyr Ser Val Arg Lys Gly His Phe Asp Thr Leu Ser Lys Gly Glu 
20 25 30 

40 

Leu Lys Gin Leu Leu Thr Lys Glu Leu Ala Asn Thr He Lys Asn He 
35 40 45 

Lys Asp Lys Ala Val He Asp Glu lie Phe Gin Gly Leu Asp Ala Asn 
45 50 55 60 

Gin Asp Glu Gin Val Asp Phe Gin Glu Phe He Ser Leu Val Ala He 
65 70 75 80 

50 Ala Leu Lys Ala Ala His Tyr His Thr His Lys Glu 

85 90 



55 <210> 24 
<211> 85 
<212> PRT 
<213> Homo 



sapiens 
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<400> 24 

Asp Asn Gly Asp Val Cys Gin Asp Cys He Gin Met Val Thr Asp He 
1 5 10 15 

5 

Gin Thr Ala Val Arg Thr Asn Ser Thr Phe Val Gin Ala Leu Val Glu 
20 25 30 

His Val Lys Glu Glu Cys Asp Arg Leu Gly Pro Gly Met Ala Asp He 
10 35 40 45 

Cys Lys Asn Tyr He Ser Gin Tyr Ser Glu He Ala lie Gin Met Met 
50 55 60 

15 Met His Met Gin Asp Gin Gin Pro Lys Glu He Cys Ala Leu Val Gly 
65 70 75 80 



Phe Cys Asp Glu Val 
85 



20 



<210> 25 

<211> 381 

25 <212> PRT 

<213> Homo sapiens 

<400> 25 

Met Ala Glu Ser His Leu Leu Gin Trp Leu Leu Leu Leu Leu Pro Thr 
30 1 5 10 15 

Leu Cys Gly Pro Gly Thr Ala Ala Trp Thr Thr Ser Ser Leu Ala Cys 
20 25 30 

35 Ala Gin Gly Pro Glu Phe Trp Cys Gin Ser Leu Glu Gin Ala Leu Gin 
35 40 45 

Cys Arg Ala Leu Gly His Cys Leu Gin Glu Val Trp Gly His Val Gly 
50 55 60 

40 

Ala Asp Asp Leu Cys Gin Glu Cys Glu Asp He Val His He Leu Asn 
65 70 75 80 

Lys Met Ala Lys Glu Ala He Phe Gin Asp Thr Met Arg Lys Phe Leu 
45 85 90 95 

Glu Gin Glu Cys Asn Val Leu Pro Leu Lys Leu Leu Met Pro Gin Cys 
100 105 110 

50 Asn Gin Val Leu Asp Asp Tyr Phe Pro Leu Val lie Asp Tyr Phe Gin 
115 120 125 

Asn Gin lie Asp Ser Asn Gly lie Cys Met His Leu Gly Leu Cys Lys 
130 135 140 

55 

Ser Arg Gin Pro Glu Pro Glu Gin Glu Pro Gly Met Ser Asp Pro Leu 
145 150 155 160 
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Pro Lys Pro Leu Arg Asp Pro Leu Pro Asp Pro Leu Leu Asp Lys Leu 
165 170 175 

Val Leu Pro Val Leu Pro Gly Ala Leu Gin Ala Arg Pro Gly Pro His 
5 180 185 190 

Thr Gin Asp Leu Ser Glu Gin Gin Phe Pro lie Pro Leu Pro Tyr Cys 
195 200 205 

10 Trp Leu Cys Arg Ala Leu lie Lys Arg lie Gin Ala Met lie Pro Lys 
210 215 220 



15 



Gly Ala Leu Arg Val Ala Val Ala Gin Val Cys Arg Val Val Pro Leu 

225 230 235 240 

Val Ala Gly Gly He Cys Gin Cys Leu Ala Glu Arg Tyr Ser Val He 

245 250 255 



Leu Leu Asp Thr Leu Leu Gly Arg Met Leu Pro Gin Leu Val Cys Arg 
20 260 265 270 

Leu Val Leu Arg Cys Ser Met Asp Asp Ser Ala Gly Pro Arg Ser Pro 
275 280 285 

25 Thr Gly Glu Trp Leu Pro Arg Asp Ser Glu Cys His Leu Cys Met Ser 
290 295 300 



30 



Val Thr Thr Gin Ala Gly Asn Ser Ser Glu Gin Ala He Pro Gin Ala 
305 310 315 320 

Met Leu Gin Ala Cys Val Gly Ser Trp Leu Asp Arg Glu Lys Cys Lys 
325 330 335 



Gin Phe Val Glu Gin His Thr Pro Gin Leu Leu Thr Leu Val Pro Arg 
35 340 345 350 

Gly Trp Asp Ala His Thr Thr Cys Gin Ala Leu Gly Val Cys Gly Thr 
355 360 365 



40 Met Ser Ser Pro Leu Gin Cys He His Ser Pro Asp Leu 
370 375 380 



45 <210> 26 
<211> 379 
<212> PRT 

<213> Homo sapiens 

50 <400> 26 

Met Ala Glu Ser His Leu Leu 
1 5 

Leu Cys Gly Pro Gly Thr Ala 
55 20 

Ala Gin Gly Pro Glu Phe Trp 
35 



Gin Trp Leu Leu Leu Leu Leu Pro Thr 
10 15 

Ala Trp Thr Thr Ser Ser Leu Ala Cys 
25 30 

Cys Gin Ser Leu Glu Gin Ala Leu Gin 
40 45 
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Cys Arg Ala Leu Gly His Cys Leu Gin Glu Val Trp Gly His Val Gly 
50 55 60 

5 Ala Asp Asp Leu Cys Gin Glu Cys Glu Asp lie Val His lie Leu Asn 
65 70 75 80 

Lys Met Ala Lys Glu Ala lie Phe Gin Asp Thr Met Arg Lys Phe Leu 
85 90 95 

10 

Glu Gin Glu Cys Asn Val Leu Pro Leu Lys Leu Leu Met Pro Gin Cys 
100 105 110 

Asn Gin Val Leu Asp Asp Tyr Phe Pro Leu Val lie Asp Tyr Phe Gin 
15 115 120 125 

Asn Gin Thr Asp Ser Asn Gly lie Cys Met His Leu Gly Cys Lys Ser 
130 135 140 

20 Arg Gin Pro Glu Pro Glu Gin Glu Pro Gly Met Ser Asp Pro Leu Pro 
145 150 155 160 

Lys Pro Leu Arg Asp Pro Leu Pro Asp Pro Leu Leu Asp Lys Leu Val 
165 170 175 

25 

Leu Pro Val Leu Pro Gly Ala Leu Gin Ala Arg Pro Gly Pro His Thr 
180 185 190 

Gin Asp Leu Ser Glu Gin Gin Phe Pro He Pro Leu Pro Tyr Cys Trp 
30 195 200 205 

Cys Arg Ala Leu He Lys Arg He Gin Ala Met He Pro Lys Gly Ala 
210 215 220 

35 Leu Arg Val Ala Val Ala Gin Val Cys Arg Val Val Pro Leu Val Ala 
225 " 230 235 240 

Gly Gly He Cys Gin Cys Leu Ala Glu Arg Tyr Ser Val He Leu Leu 
245 250 255 

40 

Asp Thr Leu Leu Gly Arg Met Leu Pro Gin Leu Val Cys Arg Leu Val 
260 265 270 

Leu Arg Cys Ser Met Asp Asp Ser Ala Gly Pro Arg Ser Pro Thr Gly 
45 275 280 285 

Glu Trp Leu Pro Arg Asp Ser Glu Cys His Leu Cys Met Ser Val Thr 
290 295 300 

50 Thr Gin Ala Gly Asn Ser Ser Glu Gin Ala He Pro Gin Ala Met Leu 
305 310 315 320 

Gin Ala Cys Val Gly Ser Trp Leu Asp Arg Glu Lys Cys Lys Gin Phe 
325 330 335 

55 

Val Glu Gin His Thr Pro Gin Leu Leu Thr Leu Val Pro Arg Gly Trp 
340 345 350 
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Asp Ala His Thr Thr Cys Gin Ala Leu Gly Val Cys Gly Thr Met Ser 
355 360 365 



Ser Pro Leu Gin Cys lie His Ser Pro Asp Leu 
370 375 



<210> 27 
10 <211> 527 
<212> PRT 

<213> Homo sapiens 
<400> 27 

15 Met Tyr Ala Leu Phe Leu Leu Ala Ser Leu Leu Gly Ala Ala Leu Ala 
15 10 15 

Gly Pro Val Leu Gly Leu Lys Glu Cys Thr Arg Gly Ser Ala Val Trp 
20 25 30 

20 

Cys Gin Asn Val Lys Thr Ala Ser Asp Cys Gly Ala Val Lys His Cys 
35 40 45 

Leu Gin Thr Val Trp Asn Lys Pro Thr Val Lys Ser Leu Pro Cys Asp 
25 50 55 60 

lie Cys Lys Asp Val Val Thr Ala Ala Gly Asp Met Leu Lys Asp Ash 
65 70 75 80 

30 Ala Thr Glu Glu Glu He Leu Val Tyr Leu Glu Lys Thr Cys Asp Trp 

85 90 95 

Leu Pro Lys Pro Asn Met Ser Ala Ser Cys Lys Glu He Val Asp Ser 
100 105 110 

35 

Tyr Leu Pro Val He Leu Asp He He Lys Gly Glu Met Ser Arg Pro 
115 120 125 

Gly Glu Val Cys Ser Ala Leu Asn Leu Cys Glu Ser Leu Gin Lys His 
40 130 135 140 

Leu Ala Glu Leu Asn His Gin Lys Gin Leu Glu Ser Asn Lys He Pro 
145 150 155 160 

45 Glu Leu Asp Met Thr Glu Val Val Ala Pro Phe Met Ala Asn He Pro 

165 170 175 

Leu Leu Leu Tyr Pro Gin Asp Gly Pro Arg Ser Lys Pro Gin Pro Lys 
180 185 190 

50 

Asp Asn Gly Asp Val Cys Gin Asp Cys He Gin Met Val Thr Asp He 
195 200 205 

Gin Thr Ala Val Arg Thr Asn Ser Thr Phe Val Gin Ala Leu Val Glu 
55 210 215 220 



His Val Lys Glu Glu Cys Asp Arg Leu Gly Pro Gly Met Ala Asp He 
225 230 235 240 
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10 



Cys Lys Asn Tyr lie Ser Gin Tyr Ser Glu He Ala He Gin Met Met 
245 250 255 

Met His Met Gin Asp Gin Gin Pro Lys Glu He Cys Ala Leu Val Gly 
260 265 270 

Phe Cys Asp Glu Val Lys Glu Met Pro Met Gin Thr Leu Val Pro Ala 
275 280 285 

Lys Val Ala Ser Lys Asn Val He Pro Ala Leu Glu Leu Val Glu Pro 
290 295 300 



15 



lie Lys Lys His Glu Val Pro Ala Lys Ser Asp Val Tyr Cys Glu Val 
305 310 315 320 



Cys Glu Phe Leu Val Lys Glu Val Thr Lys Leu lie Asp Asn Asn Lys 
325 330 335 

20 Thr Glu Lys Glu lie Leu Asp Ala Phe Asp Lys Met Cys Ser Lys Leu 
340 345 350 



25 



Pro Lys Ser Leu Ser Glu Glu Cys Gin Glu Val Val Asp Thr Tyr Gly 
355 360 365 

Ser Ser lie Leu Ser He Leu Leu Glu Glu Val Ser Pro Glu Leu Val 
370 375 380 



Cys Ser Met Leu His Leu Cys Ser Gly Thr Arg Leu Pro Ala Leu Thr 

30 385 390 395 400 

Val His Val Thr Gin Pro Lys Asp Gly Gly Phe Cys Glu Val Cys Lys 
405 410 415 

35 Lys Leu Val Gly Tyr Leu Asp Arg Asn Leu Glu Lys Asn Ser Thr Lys 
420 425 430 



40 



Gin Glu lie Leu Ala Ala Leu Glu Lys Gly Cys Ser Phe Leu Pro Asp 
435 440 445 

Pro Tyr Gin Lys Gin Cys Asp Gin Phe Val Ala Glu Tyr Glu Pro Val 
450 455 460 



45 



Leu lie Glu lie Leu Val Glu Val Met Asp Pro Ser Phe Val Cys Leu 
465 470 475 480 



Lys lie Gly Ala Cys Pro Ser Ala His Lys Pro Leu Leu Gly Thr Glu 
485 490 495 

50 Lys Cys He Trp Gly Pro Ser Tyr Trp Cys Gin Asn Thr Glu Thr Ala 
500 505 510 



Ala Gin Cys Asn Ala Val Glu His Cys Lys Arg His Val Trp Asn 
515 520 525 



55 



<210> 28 
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<211> 523 
<212> PRT 

<213> Homo sapiens 
5 <400> 28 

Met Tyr Ala Leu Phe Leu Leu Ala Ser Leu Leu Gly Ala Ala Leu Ala 
15 10 15 

Gly Pro Val Leu Gly Leu Lys Glu Cys Thr Arg Gly Ser Ala Val Trp 
10 20 25 30 

Cys Gin Asn Val Lys Thr Ala Ser Asp Cys Gly Ala Val Lys His Cys 
35 40 45 

15 Leu Gin Thr Val Trp Asn Lys Pro Thr Val Lys Ser Leu Pro Cys Asp 
50 55 60 

He Cys Lys Asp Val Val Thr Ala Ala Gly Asp Met Leu Lys Asp Asn 
65 70 75 80 

20 

Ala Thr Glu Glu Glu He Leu Val Tyr Leu Glu Lys Thr Cys Asp Trp 
85 90 95 

Leu Pro Lys Pro Asn Met Ser Ala Ser Cys Lys Glu He Val Asp Ser 
25 100 105 110 

Tyr Leu Pro Val He Leu Asp He He Lys Gly Glu "Met Ser Arg Pro 
115 120 125 

30 Gly Glu Val Cys Ser Ala Leu Leu Cys Glu Ser Leu Gin Lys His Leu 
130 135 140 

Ala Glu Leu Asn His Gin Lys Gin Leu Glu Ser Asn Lys He Pro Glu 
145 150 155 160 

35 

Leu Asp Met Thr Glu Val Val Ala Pro Phe Met Ala Asn He Pro Leu 
165 170 175 

Leu Leu Tyr Pro Gin Asp Gly Pro Arg Ser Lys Pro Gin Pro Lys Asp 
40 180 185 190 

Asn Gly Asp Val Cys Gin Asp Cys He Gin Met Val Thr Asp He Gin 
195 200 205 

45 Thr Ala Val Arg Thr Asn Ser Thr Phe Val Gin Ala Leu Val Glu His 
210 215 220 

Val Lys Glu Glu Cys Asp Arg Leu Gly Pro Gly Met Ala Asp He Cys 
225 230 235 240 

50 

Lys Asn Tyr He Ser Gin Tyr Ser Glu He Ala He Gin Met Met Met 
245 250 255 

His Met Gin Pro Lys Glu He Cys Ala Leu Val Gly Phe Cys Asp Glu 
55 260 265 270 



Val Lys Glu Met Pro Met Gin Thr Leu Val Pro Ala Lys Val Ala Ser 
275 280 285 
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Lys Asn Val lie Pro Ala Leu Glu Leu Val Glu Pro lie Lys Lys His 
290 295 300 

5 Glu Vai Pro Ala Lys Ser Asp Val Tyr Cys Glu Val Cys Glu Phe Leu 
305 310 315 320 

Val Lys Giu Val Thr Lys Leu lie Asp Asn Asn Lys Thr Glu Lys Glu 
325 330 335 

10 

lie Leu Asp Ala Phe Asp Lys Met Cys Ser Lys Leu Pro Lys Ser Leu 
340 345 350 

Ser Glu Glu Cys Gin Glu Val Val Asp Thr Tyr Gly Ser Ser lie Leu 
15 355 360 365 

Ser lie Leu Leu Glu Glu Val Ser Pro Glu Leu Val Cys Ser Met Leu 
370 375 380 

20 His Leu Cys Ser Gly Thr Arg Leu Pro Ala Leu Thr Val His Val Thr 
385 390 395 400 

Gin Pro Lys Asp Gly Gly Phe Cys Glu Val Cys Lys Lys Leu Val Gly 
405 410 415 

25 

Tyr Leu Asp Arg Asn Leu Glu Lys Asn Ser Thr Lys Gin Glu lie Leu 
420 425 430 

Ala Ala Leu Glu Lys Gly Cys Ser Phe Leu Pro Asp Pro Tyr Gin Lys 
30 435 440 445 

Gin Cys Asp Gin Phe Val Ala Glu Tyr Glu Pro Val Leu He Glu He 
450 455 460 

35 Leu Val Glu Val Met Asp Pro Ser Phe Val Cys Leu Lys He Gly Ala 
465 470 475 480 

Cys Pro Ser Ala His Lys Pro Leu Leu Gly Thr Glu Lys Cys He Trp 
485 490 495 

40 

Gly Pro Ser Tyr Trp Cys Gin Asn Thr Glu Thr Ala Ala Gin Cys Asn 
500 505 510 

Ala Val Glu His Cys Lys Arg His Val Trp Asn 
45 515 520 



<210> 29 
50 <211> 380 
<212> PRT 

<213> Homo sapiens 
<400> 29 

55 Met Ala Glu Ser His Leu Leu Gin Trp Leu Leu Leu Leu Leu Pro Thr 
1 5 10 15 



Leu Cys Gly Pro Gly Thr Ala Ala Trp Thr Thr Ser Ser Leu Ala Cys 
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20 



25 



30 



Ala Gin Gly Pro Glu Phe Trp Cys Gin Ser Leu Glu Gin Ala Leu Gin 

35 40 45 

Cys Arg Ala Leu Gly His Cys Leu Gin Glu Val Trp Gly His Val Gly 
50 55 60 



10 



Ala Asp Asp Leu Cys Gin Glu Cys Glu Asp He Val His He Leu Asn 
65 70 75 80 



Lys Met Ala Lys Glu Ala He Phe Gin Asp Thr Met Arg Lys Phe Leu 

85 90 95 

15 Glu Gin Glu Cys Asn Val Leu Pro Leu Lys Leu Leu Met Pro Gin Cys 

100 105 HO 



20 



Asn Gin Val Leu Asp Asp Tyr Phe Pro Leu Val He Asp Tyr Phe Gin 
115 120 125 

Asn Gin Thr Asp Ser Asn Gly He Cys Met His Gly Leu Cys Lys Ser 

130 135 140 



25 



Arg Gin Pro Glu Pro Glu Gin Glu Pro Gly Met Ser Asp Pro Leu Pro 
145 150 155 160 



Lys Pro Leu Arg Asp Pro Leu Pro Asp Pro Leu Leu Asp Lys- Leu Val 
165 170 175 

30 Leu Pro Val Leu Pro Gly Ala Leu Gin Ala Arg Pro Gly Pro His Thr 
180 185 190 



35 



Gin Asp Leu Ser Glu Gin Gin Phe Pro He Pro Leu Pro Tyr Cys Trp 
195 200 205 

Leu Cys Arg Ala Leu He Lys Arg He Gin Ala Met He Pro Lys Gly 
210 215 220 



40 



Ala Leu Ala Val Ala Val Ala Gin Val Cys Arg Val Val Pro Leu Val 
225 230 235 240 



Ala Gly Gly He Cys Gin Cys Leu Ala Glu Arg Tyr Ser Val He Leu 
245 250 255 

45 Leu Asp Thr Leu Leu Gly Arg Met Leu Pro Gin Leu Val Cys Arg Leu 
260 265 270 



50 



Val Leu Arg Cys Ser Met Asp Asp Ser Ala Gly Pro Arg Ser Pro Thr 
275 280 285 

Gly Glu Trp Leu Pro Arg Asp Ser Glu Cys His Leu Cys Met Ser Val 
290 295 300 



55 



Thr Thr Gin Ala Gly Asn Ser Ser Glu Gin Ala He Pro Gin Ala Met 
305 310 315 320 



Leu Gin Ala Cys Val Gly Ser 
325 



Trp Leu Asp Arg Glu 
330 



Lys Cys Lys Gin 
335 
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Phe Val Glu Gin His Thr Pro Gin Leu Leu Thr Leu Val Pro Arg Gly 
340 345 350 

Trp Asp Ala His Thr Thr Cys Gin Ala Leu Gly Val Cys Gly Thr Met 
355 360 365 

Ser Ser Pro Leu Gin Cys He His Ser Pro Asp Leu 
370 375 380 



<210> 30 

<211> 4124 

<212> ADN 

<213> Homo sapiens 

<400> 30 

atgagagaat gggttctgct catgtccgtg ctgctctgtg gcctggctgg ccccacacac 60 
ctgttccagc caagcctggt gctggacatg gccaaggtcc tcttggataa ctactgcttc 120 
ccggagaacc tgctgggcat gcaggaagcc atccagcagg ccatcaagag ccatgagatt 180 
ctgagcatct cagacccgca gacgctggcc agtgtgctga cagccggggt gcagagctcc 24 0 
ctgaacgatc ctcgcctggt catctcctat gagcccagca cccccgagcc tcccccacaa 300 
gtcccagcac tcaccagcct ctcagaagag gaactgcttg cctggctgca aaggggcctc 360 
cgccatgagg ttctggaggg taatgtgggc tacctgcggg tggacagcgt cccgggccag 420 
gaggtgctga gcatgatggg ggagttcctg gtggcccacg tgtgggggaa tctcatgggc 480 
acctccgcct tagtgctgga tctccggcac tgcacaggag gccaggtctc tggcattccc 540 
tacatcatct cctacctgca cccagggaac accatcctgc acgtggacac tatctacaac 600 
cgcccctcca acaccaccac ggagatctgg accttgcccc aggtcctggg agaaaggtac 660 
ggtgccgaca aggatgtggt ggtcctcacc agcagccaga ccaggggcgt ggccgaggac 720 
atcgcgcaca tccttaagca gatgcgcagg gccatcgtgg tgggcgagcg gactggggga 780 
ggggccctgg acctccggaa gctgaggata ggcgagtctg acttcttctt cacggtgccc 84 0 
gtgtccaggt ccctggggcc ccttggtgga ggcagccaga cgtgggaggg cagcggggtg 900 
ctgccctgtg tggggactcc ggccgagcag gccctggaga aagccctggc catcctcact 960 
ctgcgcagcg cccttccagg ggtagtccac tgcctccagg aggtcctgaa ggactactac 1020 
acgctggtgg accgtgtgcc caccctgctg cagcacttgg ccagcatgga cttctccacg 1080 
gtggtctccg aggaagatct ggtcaccaag ctcaatgccg gcctgcaggc tgcgtctgag 1140 
gatcccaggc tcctggtgcg agccatcggg cccacagaaa ctccttcttg gcccgcgccc 1200 
gacgctgcag ccgaagactc accaggggtg gccccagagt tgcctgagga cgaggctatc 1260 
cggcaagcac tggtggactc tgtgttccag gtgtcggtgc tgccaggcaa tgtgggctac 1320 
ctgcgcttcg atagttttgc tgacgcctcc gtcctgggtg tgttggcccc atatgtcctg 1380 
cgccaggtgt gggagccgct acaggacacg gagcacctca tcatggacct gcgccacaac 1440 
cctggagggc catcctctgc tgtgcccctg ctcctgtcct acttccaggg ccctgaggcc 1500 
ggccccgtgc acctcttcac cacctatgat cgccgcacca acatcacgca ggagcacttc 1560 
agccacatgg agctcccggg cccacgctac agcacccaac gtggggtgta tctgctcacc 1620 
agccaccgca ccgccacggc cgcggaggag ttcgccttcc ttatgcagtc gctgggctgg 1680 
gccacactgg taggtgagat caccgcgggc aacctgctgc acacccgcac ggtgccgctg 1740 
ctggacacac ccgaaggcag cctcgcgctc accgtgccgg tcctcacctt catcgacaat 1800 
cacggcgagg cctggctggg tggtggagtg gtgcccgatg ccatcgtgct ggccgaggag 1860 
gccctggaca aagcccagga agtgctggag ttccaccaaa gcctgggggc cttggtggag 1920 
ggcacagggc acctgctgga ggcccactat gctcggccag aggtcgtggg gcagaccagt 1980 
gccctcctgc gggccaagct ggcccagggc gcctaccgca cagctgtgga cttggagtct 204 0 
ctggcctctc agctcacagc agacctccag gaggtgtctg gggaccaccg cttgctagtg 2100 
ttccacagcc ctggcgagct ggtggtagag gaagcacccc caccaccccc tgctgtcccc 2160 
tctccagagg agctcaccta ccttattgag gccctgttca agacagaggt gctgcccggc 2220 
cagctgggct acctgcgttt tgacgocatg gctgaactgg agacagtgaa ggccgtgggg 2280 
ccacagctgg tgcggctggt atggcaacag ctggtggaca cggctgcgct ggtgatcgac 234 0 
ctgcgctaca accctggcag ctactccacg gccatcccgc tgctctgctc ctacttcttt 2400 
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gaggcagagc cccgccagca cctgtattct 
gaggtgtgga ccttgcccca ggtcgccggc 
atcctgatga gccacaccag tggctctgcg 
ccgcagcggg ccacggtcat tggggagccc 
5 taccaggtgg gcagcagccc cttatatgca 
accacaggca aggcctggga cctggctggt 
gaagcccttt ccatagccca ggacatagtg 
cagacggccg ggaagctggt ggctgataac 
gccaccaaac tgagcggtct gcagagccgc 

10 gccgagatcc tgggggctga cctgcagatg 
catatccctg agaatgccaa ggaccgcatt 
cctgaagtat ttgaagagct gatcaagttt 
attggctact tgaggtttga catgtttggg 
ctgctggtgg agcacatctg gaagaagatc 

15 aggttcaaca tcggtggccc cacatcctcc 
gaaggccctc cagttctgct ggacaagatc 
ctctggacac acgcccaggt tgtaggtgaa 
ctgaccagca gtgtgacggc cggcaccgcg 
ggccgggccc tggtcattgg ggaggtgacc 

20 cacgtggatg acaccaacct ctacctcact 
gatggcagct cctgggaagg ggtgggggtg 
gctctcgcca gggccaagga gatgctccag 
ggcctgcagg accacctgta gggaagggcc 
ctctgggaca cacaccaagg gcactcctgc 

25 gcaaaggggc ctgctgagct ctggttaggt 
cacacatgta tatacacata tatatgtgta 
caataaccac ctaaatttta acaaaggttc 
tttaccttcc ttcttcatac tttgctcttt 
attattttca gatgcagcta tcattattcc 

30 

<210> 31 
<211> 579 
<212> ADN 
35 <213> Homo sapiens 



gtctttgaca gggccacctc aaaagtcacg 2460 
cagcgctacg gctcacacaa ggacctctac 2520 
gccgaggcct ttgcacacac catgcaggac 2580 
acggccggag gcgcactctc tgtgggcatc 2 640 
tccatgccca cccagatggc catgagtgcc 2700 
gtggagcccg acatcactgt gcccatgagc 2760 
gctctgcgtg ccaaggtgcc cacggtgctg 2820 
tatgcctctg ccgagctggg ggccaagatg 2880 
tactccaggg tgacctcaga agtggcccta 2 940 
ctctccggag acccacacct gaaggcagcc 3000 
cctggaattg tgcccatgca gatcccttcc 3060 
tccttccaca ctaacgtgct tgaggacaac 3120 
gacggtgagc tgctcaccca ggtctccagg 3180 
atgcacacgg atgccatgat catcgacatg 3240 
attcccatct tgtgctccta cttctttgat 3300 
tacagccggc ctgatgactc tgtcagtgaa 3360 
cgctatggct ccaagaagag catggtcatt 3420 
gaggagttca cctatatcat gaagaggctg 3480 
agtgggggct gccagccacc acagacctac 3540 
atccccacgg cccgttctgt gggggcctcg 3600 
acaccccatg tggttgtccc tgcagaagag 3660 
cacaaccagc tgagggtgaa gcggagccca 3720 
ccataggcag agccccaggg cagacagaac 3780 
aggtggcccg gcctgaggtt cccaggagca 3840 
tacagctgga ggtgtgtata tatacacaca 3 900 
tgtatatata tgtatatata tatggctttc 3960 
cttctaagtg gtagaacttg gggtggtatt 4020 
ttcttaaata ctcattaatg tgcatatatc 4080 
aaaatacaaa ataa 4124 



<400> 31 

atgcarwsny tnatgcargc nccnytnytn 
gcncargcnc ayytnaaraa rccnwsncar 

40 garggnaarg ayccngcngt nathmgnwsn 
ccnggnaayg tnacnytnws ngtngtnggn 
aargtngayy tngtnytnga raargargtn 
gaytayathg gnwsntgyac nttygarcay 
acnggngarc cntgyccnga rccnytnmgn 

45 aargarggna cntaywsnyt nccnaarwsn 
wsntggytna cnacnggnaa ytaymgnath 
ytnggntgya thaarathgc ngcnwsnytn 



athgcnytng gnytnytnyt ngcnacnccn 60 
ytnwsnwsnt tywsntggga yaaytgygay 120 
ytnacnytng arccngaycc nathgtngtn 180 
wsnacnwsng tnccnytnws nwsnccnytn 240 
gcnggnytnt ggathaarat hccntgyacn 300 
ttytgygayg tnytngayat gytnathccn 360 
acntayggny tnccntgyca ytgyccntty 420 
garttygtng tnccngayyt ngarytnccn 480 
gairwsngtny tnwsnwsnws nggnaarmgn 540 
aarggnath 579 



50 <210> 32 
<211> 633 
<212> ADN 
<213> Homo sapiens 



55 <400> 32 

tttctttgcg taaccaatac tggaaggcat 
agttaactcc gccctgaccc acccttcccg 
atcgccctgg gcttgcttct cgcgacccct 



ttaaaggacc tctgccgcct cagaccttgc 60 
atgcagtccc tgatgcaggc tcccctcctg 120 
gcgcaagccc acctgaaaaa ggtgagtgca 180 
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ccctctttta agagtctgtt tgcagcctcc 
gagatatggg ggtggccact ccgttctcta 
agtaactaat tatgggattc tggtctgtac 
ctccaggccc tttttggaga gattaatctc 
cgccggagtg aaaatgcaga cagccttaaa 
ctgttaaccc tgcaccttac tcctgacccc 
ctgcctcatc tcttcccctg ctcgaatgcc 
gagagctttc caaggccaag aggattcact 



tggcccagct acgggtgtgc gggtctggct 24 0 
gaattggttc tctgcactag agccttccaa 300 
aatgagggtg gcctctaaag acttgttctg 360 
acgtctgcac tctcctgccc tccctccaag 420 
actaaggcat tgcccccaag agattcagtc 480 
cactccttat gtcccccatg ataaggcctg 540 
ctgaggtctt cctgagagtt gggagggttt 600 
aag 633 



<210> 33 

<211> 1047 

<212> ADN 

<213> Homo sapiens 

<400> 33 

caggagcttg ccctcttgct gggattccaa 
ggtgggaagt cagagaaggt gcccaccaaa 
ttccaggtct atcatatcct gccttatagt 
ttgagtcttt tagtttagtc ctgcctataa 
ataggtatgg agtctcatag atgaggctca 
tgccaggagc tcatttttcc tgtgatctgt 
tctccttcct tgctgcctga ttgtccccag 
aactgtgatg aagggaagga ccctgcggtg 
atcgtcgttc ctggaaatgt gaccctcagt 
tctcctctga aggtgagcct gggggtgggt 
caggggtact ggggcatgta tgcttgggga 
cagagaatag tacaggacat gtagattcag 
gatcataaga ttgaaaggaa tctctgatgt 
agtgacggat accttgcacc tggcagaagc 
ctgctcatta ttatctgaca gctctggttg 
ttgatatacc aattagccag taatatatag 
taaataaaat aggccaagtg tggtaacttc 
tgaaggtggg tgggatcctt tttgagg 



cgctggctgg agaggagtgg gcagcaggga 60 
ggcctattag gtcagtctcc tgtttggaag 120 
ttacaataca cttttgggag attatgtctt 180 
aatgagtagg ataagtgtta tcccaggttc 240 
gggacggggg tgcctcaccc aaggtcacac 300 
gatagtttct tttgtcaacc tttttcttct 360 
ccatcccagc tcagtagctt ttcctgggat 420 
atcagaagcc tgactctgga gcctgacccc 480 
gtcgtgggca gcaccagtgt ccccctgagt 540 
ggagaagggg aggtgcgagg gtctggccag 600 
actgtgaaga atttcagaat cctggattcc 660 
acactctttc acaggttcat ggaatctcag 720 
cagcgccagc aacttcctgg tgagggcagg 780 
gtcctggcct tctctgggcc tggtggccaa 840 
gccaatttgg ttttgctgtt aattataaaa 900 
tcactttaga aaacacaagt ggtcaaaaaa 960 
atgcctgtaa ttcccacacc cttaggaggc 1020 

1047 



<210> 34 

<211> 1706 

<212> ADN 

<213> Homo sapiens 

<400> 34 

acagtagatg ccagtgcatt tcaatgcaag 
ctaaagaatt ttaagactat ggattgagca 
tggaaggtga aggtgaaagg attgcttgag 
aagtgagccc catctctaca aaaaatacaa 
ctgtgtttcc cacctacatg ggaggctgag 
aggctgcagt gagtgcagtg agccatgata 
atgtatagtt cagtgtaggg ggaaaattca 
aataatacac tatactcaca catgggccac 
taagatctca tccagttaaa aattctatga 
gaagagctgg tatgtttgcc ctggaattta 
attttttttt accaggtgga tttagttttg 
atcccatgca cagactacat tggcagctgt 
atgttaattc ctactgggga gccctgccca 
cactgtccct tcaaagaagt aagtacttag 
gagatggggt ttggagagaa gggtctttgc 
gatttgtaag ccagtgtgac ctatcaggaa 



tgttagagcc aatcaatggg tagtgactac 60 
tgatggctca cggcctgtaa tcccagcctt 120 
gccaggagtt ccagaccagc ttgggcaaca 180 
aattagctgg gtgtggtggc atgtgcctgt 240 
gcaggaggat cgtctgagcc caggagtttg 300 
caaaaaaaaa aaataaagaa ttctaagtct 360 
catttgatta ttaatgtctg ccatgggcac 420 
aatgttgcca ttcctagaac agactatctc 480 
ttaaaatata ttgctgcttt tttgaagaca 540 
cacttataac ctttttcaaa cctttgtttt 600 
gagaaggagg tggctggcct ctggatcaag 660 
acctttgaac acttctgtga tgtgcttgac 720 
gagcccctgc gtacctatgg gcttccttgc 780 
ggaggagaga gcgttacccc tgtggctaaa 840 
attctccttc tgcagatctg catgtctctg 900 
tcacttatct tccgggagcc tcagttatcc 960 
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atctacgaaa tgggagactt gaacttagat 
ccatgctcta cagtgctatg gccgtctctc 
a 9999tggta gttcatggct gcaatcctag 
aggctcccac tgactggcgg tccactggct 
agcgaattcg ttgtgcctga cctggagctg 
atagagagcg tcctgagcag cagtgggaag 
ctaaagggca tatagcatgg catctgccac 
ttttcctctg ttttgtgttt gccaaggcca 
ctttctacag tgagtccact accctcactg 
ctggggcaag cagccctgac ctaagggaga 
catctgctgg gctgaccacg ttactcatcc 
catttccaaa gcagttaagg aatgggaaca 
actctctctc tttctctctt tttttt 



gtgatcttca gggcccttta tccatataac 1020 
atcttgtgcg gctgttttga gaatgggaag 1080 
cagtggctct aggagaaaga ccccatcagt 1140 
ttcccgcagg gaacctactc actgcccaag 1200 
cccagttggc tcaccaccgg gaactaccgc 1260 
cgtctgggct gcatcaagat cgctgcctct 1320 
agcagaatgg agcggtgtga ggaaggtccc 1380 
aactcccact ctctgccccc ctttaatccc 1440 
aaaatcattt tgtaccactt acattttagg 1500 
atgagttgga cagttcttga tagcccaggg 1560 
ccgttaacat tctctctaaa gagcctcgtt 1620 
gagtgtttta ggacctgaag aatctttatg 1680 

1706 



<210> 35 
<211> 633 
<212> ADN 

<213> Homo sapiens 
<400> 35 

tttctttgcg taaccaatac tggaaggcat 
agttaactcc gccctgaccc acccttcccg 
atcgccctgg gcttgcttct cgcgacccct 
ccctctttta agagtctgtt tgcagcctcc 
gagatatggg ggtggccact ccgttctcta 
agtaactaat tatgggattc tggtctgtac 
ctccaggccc tttttggaga gattaatctc 
cgccggagtg aaaatgcaga cagccttaaa 
ctgttaaccc tgcaccttac tcctgacccc 
ctgcctcatc tcttcccctg ctcgaatgcc 
gagagctttc caaggccaag aggattcact 



ttaaaggacc tctgccgcct cagaccttgc 60 
atgcagtccc tgatgcaggc tcccctcctg 120 
gcgcaagccc acctgaaaaa ggtgagtgca 180 
tggcccagct acgggtgtgc gggtctggct 240 
gaattggttc tctgcactag agccttccaa 300 
aatgagggtg gcctctaaag acttgttctg 360 
acgtctgcac tctcctgccc tccctccaag 420 
actaaggcat tgcccccaag agattcagtc 480 
cactccttat gtcccccatg ataaggcctg 540 
ctgaggtctt cctgagagtt gggagggttt 600 
aag 633 



<210> 36 
<211> 1047 
<212> ADN 

<213> Homo sapiens 
<400> 36 

caggagcttg ccctcttgct gggattccaa 
ggtgggaagt cagagaaggt gcccaccaaa 
ttccaggtct atcatatcct gccttatagt 
ttgagtcttt tagtttagtc ctgcctataa 
ataggtatgg agtctcatag atgaggctca 
tgccaggagc tcatttttcc tgtgatctgt 
tctccttcct tgctgcctga ttgtccccag 
aactgtgatg aagggaagga ccctgcggtg 
atcgtcgttc ctggaaatgt gaccctcagt 
tctcctctga aggtgagcct gggggtgggt 
caggggtact ggggcatgta tgcttgggga 
cagagaatag tacaggacat gtagattcag 
gatcataaga ttgaaaggaa tctctgatgt 
agtgacggat accttgcacc tggcagaagc 
ctgctcatta ttatctgaca gctctggttg 
ttgatatacc aattagccag taatatatag 
taaataaaat aggccaagtg tggtaacttc 
tgaaggtggg tgggatcctt tttgagg 



cgctggctgg agaggagtgg gcagcaggga 60 
ggcctattag gtcagtctcc tgtttggaag 120 
ttacaataca cttttgggag attatgtctt 180 
aatgagtagg ataagtgtta tcccaggttc 24 0 
gggacggggg tgcctcaccc aaggtcacac 300 
gatagtttct tttgtcaacc tttttcttct 360 
ccatcccagc tcagtagctt ttcctgggat 420 
atcagaagcc tgactctgga gcctgacccc 4 80 
gtcgtgggca gcaccagtgt ccccctgagt 540 
ggagaagggg aggtgcgagg gtctggccag 600 
actgtgaaga atttcagaat cctggattcc 660 
acactctttc acaggttcat ggaatctcag 720 
cagcgccagc aacttcctgg tgagggcagg 780 
gtcctggcct tctctgggcc tggtggccaa 84 0 
gccaatttgg ttttgctgtt aattataaaa 900 
tcactttaga aaacacaagt ggtcaaaaaa 960 
atgcctgtaa ttcccacacc cttaggaggc 1020 

1047 
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<210> 37 
<211> 1706 
5 <212> ADN 

<213> Homo sapiens 

<400> 37 

acagtagatg ccagtgcatt tcaatgcaag tgttagagcc aatcaatggg tagtgactac 60 

10 ctaaagaatt ttaagactat ggattgagca tgatggctca cggcccgtaa tcccagcctt 120 

tggaaggtga aggtgaaagg attgcttgag gccaggagtt ccagaccagc ttgggcaaca 18 0 

aagtgagccc catctctaca aaaaatacaa aattagctgg gtgtggtggc atgcgcctgt 24 0 

ctgtgtttcc cacctacatg ggaggctgag gcaggaggat cgtctgagcc caggagtttg 300 

aggctgcagt gagtgcagtg agccatgata caaaaaaaaa aaataaagaa ttctaagtct 360 

15 atgtatagtt cagtgtaggg ggaaaattca catttgatta ttaatgtctg ccatgggcac 420 

aataatacac tatactcaca catgggccac aatgttgcca ttcctagaac agactatctc 480 

taagatctca tccagttaaa aattctatga ttaaaatata ttgctgcttt tttgaagaca 540 

gaagagctgg tatgtttgcc ctggaattta cacttataac ctttttcaaa cctttgtttC 600 

attttttttt accaggtgga tttagttttg gagaaggagg tggctggcct ctggatcaag 660 

20 atcccatgca cagactacat tggcagctgt acctttgaac acttctgtga tgtgcttgac 720 

atgttaattc ctactgggga gccctgccca gagcccctgc gtacctatgg gcttccttgc 780 

cactgtccct tcaaagaagt aagtacttag ggaggagaga gcgttacccc tgtggctaaa 84 0 

gagatggggt ttggagagaa gggtctttgc attctccttc tgcagatctg catgtctctg 900 

gatttgtaag ccagtgtgac ctatcaggaa tcacttatct tccgggagcc tcagttatcc 960 

25 atctacgaaa tgggagactt gaacttagat gtgatcttca gggcccttta tccatataat 1020 

ccatgctcta cagtgctatg gccgtctctc atcttgtgcg gctgttttga gaatgggaag 1080 

aggggtggta gttcatggct gcaatcctag cagtggctct aggagaaaga ccccatcagt 1140 

aggctcccac tgactggcgg tccactggct ttcccgcagg gaacctactc actgcccaag 1200 

agcgaattcg ttgtgcctga cctggagctg cccagttggc tcaccaccgg gaactaccgc 1260 

30 atagagagcg tcctgagcag cagtgggaag cgtctgggct gcatcaagat cgctgcctct 1320 

ctaaagggca tatagcatgg catctgccac agcagaatgg agcggtgtga ggaaggtccc 1380 

ttttcctctg ttttgtgttt gccaaggcca aactcccact ctctgccccc ctttaatccc 1440 

ctttctacag tgagtccact accctcactg aaaatcattt tgtaccactt acattttagg 1500 

ctggggcaag cagccctgac ctaagggaga atgagttgga cagttcttga tagcccaggg 1560 

35 catctgctgg gctgaccacg ttactcatcc ccgttaacat tctctctaaa gagcctcgtt 1620 

catttccaaa gcagttaagg aatgggaaca gagtgtttta ggacctgaag aatctttatg 1680 

actctctctc tttctctctt tttttt 1706 



40 <210> 38 

<211> 1043 

<212> ADN 

<213> Homo sapiens 

45 <400> 38 

tttctttgcg taaccaatac tggaaggcat ttaaaggacc tctgccgcct cagaccttgc 60 

agttaactcc gccctgaccc acccttcccg atgcagtccc tgatgcaggc tcccctcctg 120 

atcgccctgg gcttgcttct cgcgacccct gcgcaagccc acctgaaaaa gccatcccag 180 

ctcagtagct tttcctggga taactgtgat gaagggaagg accctgcggt gatcagaagc 240 

50 ctgactctgg agcctgaccc catcgtcgtt cctggaaatg tgaccctcag tgtcgtgggc 300 

agcaccagtg tccccctgag ttctcctctg aaggtggatt tagttttgga gaaggaggtg 360 

gctggcctct ggatcaagat cccatgcaca gactacattg gcagctgtac ctttgaacac 420 

ttctgtgatg tgcttgacat gttaattcct actggggagc cctgcccaga gcccctgcgt 480 

acctatgggc ttccttgcca ctgtcccttc aaagaaggaa cctactcact gcccaagagc 540 

55 gaattcgttg tgcctgacct ggagctgccc agttggctca ccaccgggaa ctaccgcata 600 

gagagcgtcc tgagcagcag tgggaagcgt ctgggctgca tcaagatcgc tgcctctcta 660 

aagggcatat agcatggcat ctgccacagc agaatggagc ggtgtgagga aggtcccttt 720 

tcctctgttt tgtgtttgcc aaggccaaac tcccactctc tgcccccctt taatcccctt 780 
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tctacagtga gtccactacc ctcactgaaa 

gggcaagcag ccctgaccta agggagaatg 

ctgctgggct gaccacgtta ctcatccccg 

ttccaaagca gttaaggaat gggaacagag 

5 ctctctcttt ctctcttttt ttt 



atcattttgt accacctaca ttttaggctg 840 
agttggacag ttcttgatag cccagggcat 900 
ttaacattct ctctaaagag cctcgttcat 960 
tgttttagga cctgaagaat ctttatgact 1020 

1043 



<210> 39 
<211> 1047 
10 <212> ADN 

<213> Homo sapiens 

<400> 39 

caggagcttg ccctcttgct gggattccaa 

15 ggtgggaagt cagagaaggt gcccaccaaa 
ttccaggtct atcatatcct gccttatagt 
ttgagtcttt tagtttagtc ctgcctataa 
ataggtatgg agtctcatag atgaggctca 
tgccaggagc teat ttt tec tgtgatctgt 

20 tctccttcct tgctgcctga ttgtccccag 
aactgtgatg aagggaagga ccctgcggtg 
ategtegtte ctggaaatgt gaccctcagt 
tctcctctga aggtgagect gggggtgggt 
caggggtact ggggcatgta tgcttgggga 

25 cagagaatag tacaggacat gtagattcag 
gatcataaga ttgaaaggaa tctctgatgt 
agtgacggat accttgcacc tggcagaagc 
ctgetcatta ttatctgaca gctctggttg 
ttgatatacc aattagccag taatatatag 

30 taaataaaat aggecaagtg tggtaacttc 
tgaaggtggg tgggatcctt tttgagg 



cgctggctgg agaggagtgg gcagcaggga 60 
ggectattag gtcagtctcc tgtttggaag 120 
ttacaataca cttttgggag attatgtctt 180 
aatgagtagg ataagtgtta tcccaggttc 240 
gggacggggg tgcctcaccc aaggtcacac 3 00 
gatagtttct tttgtcaacc tttttcttct 360 
ccatcccagc tcagtagctt ttcctgggat 420 
ateagaagee tgactctgga gcctgacccc 4 80 
gtcgtgggca gcaccagtgt ccccctgagt 540 
ggagaagggg aggtgegagg gtctggccag 600 
actgtgaaga atttcagaat cctggattcc 660 
acactctttc acaggttcat ggaatctcag 720 
cagcgccagc aacttcctgg tgagggcagg 780 
gtcctggcct tctctgggcc tggtggccaa 840 
gecaatttgg ttttgctgtt aattataaaa 900 
tcactttaga aaacacaagt ggtcaaaaaa 960 
atgcctgtaa ttcccacacc cttaggaggc 1020 

1047 



<210> 40 
35 <211> 1705 
<212> ADN 
<213> Homo sapiens 

<400> 40 

40 acagtagatg ccagtgattt caatgeaagt 
taaagaattt taagactatg gattgagcat 
ggaaggtgaa ggtgaaagga ttgettgagg 
agtgagcccc atctctacaa aaaatacaaa 
tgtgtttccc acctacatgg gaggctgagg 

45 ggctgcagtg agtgcagtga gecatgatae 
tgtatagttc agtgtagggg gaaaattcac 
ataatacact atactcacac atgggccaca 
aagatctcat ccagttaaaa attctatgat 
aagagctggt atgtttgccc tggaatttac 

50 ttttttttta ccaggtggat ttagttttgg 
tcccatgcac agactacatt ggcagctgta 
tgttaattcc tactggggag ccctgcccag 
actgtccctt caaagaagta agtacttagg 
agatggggtt tggagagaag ggtctttgea 

55 atttgtaagc cagtgtgacc tatcaggaat 
tctacgaaat gggagacttg aacttagatg 
catgctctac agtgctatgg ccgtctctca 
ggggtggtag ttcatggctg caatcctagc 



gttagageca atcaatgggt agtgactacc 60 
gatggctcac ggcctgtaat cccagccttt 12 0 
ccaggagttc cagaccagct tgggcaacaa 180 
attagctggg tgtggtggca tgtgcctgtc 240 
caggaggatc gtctgagccc aggagtttga 3 00 
aaaaaaaaaa aataaagaat tctaagtcta 360 
atttgattat taatgtctgc catgggcaca 420 
atgttgccat tcctagaaca gactatctct 4 80 
taaaatatat tgctgctttt ttgaagacag 540 
acttataacc tttttcaaac ctttgtttta 600 
agaaggaggt ggctggcctc tggatcaaga 660 
cctttgaaca cttctgtgat gtgettgaca 720 
agcccctgcg tacctatggg cttccttgcc 780 
gaggagagag cgttacccct gtggctaaag 84 0 
ttctccttct geagatctge atgtctctgg 900 
cacttatctt ccgggagcct cagttatcca 960 
tgatcttcag ggecctttat ccatataatc 1020 
tcttgtgcgg ctgttttgag aatgggaaga 1080 
agtggctcta ggagaaagac cccatcagta 114 0 
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ggctcccact gactggcggt ccactggctt 
gcgaattcgt tgtgcctgac ctggagctgc 
tagagagcgt cctgagcagc agtgggaagc 
taaagggcat atagcatggc atctgccaca 
5 tttcccctgt tttgtgtttg ccaaggccaa 
tttctacagt gagtccacta ccctcactga 
tggggcaagc agccctgacc taagggagaa 
atctgctggg ctgaccacgt tactcatccc 
atttccaaag cagttaagga atgggaacag 
10 ctctctctct ttctctcttt ttttt 



tcccgcaggg aacctactca ctgcccaaga 1200 
ccagttggct caccaccggg aactaccgca 1260 
gtctgggctg catcaagatc gctgcctctc 1320 
gcagaatgga gcggtgtgag gaaggtccct 13 80 
actcccactc tctgcccccc tttaatcccc 1440 
aaatcatttt gtaccactta cattttaggc 1500 
tgagttggac agttcttgat agcccagggc 1560 
cgttaacatt ctctctaaag agcctcgttc 1620 
agtgttttag gacctgaaga atctttatga 1680 

1705 



<210> 41 
<211> 1043 
15 <212> ADN 

<213> Homo sapiens 

<400> 41 

tttctttgcg taaccaatac tggaaggcat 

20 agttaactcc gccctgaccc acccttcccg 
atcgccctgg gcttgcttct cgcgacccct 
ctcagtagct tttcctggga taactgtgat 
ctgactctgg agcctgaccc catcgtcgtt 
agcaccagtg tccccctgag ttctcctctg 

25 gctggcctct ggatcaagat cccatgcaca 
ttctgtgatg tgcttgacat gttaattcct 
acctatgggc ttccttgcca ctgtcccttc 
gaattcgttg tgcctgacct ggagctgccc 
gagagcgtcc tgagcagcag tgggaagcgt 

30 aagggcatat agcatggcat ctgccacagc 
tcctctgttt tgtgtttgcc aaggccaaac 
tctacagtga gtccactacc ctcactgaaa 
gggcaagcag ccctgaccta agggagaatg 
ctgctgggct gaccacgtta ctcatccccg 

35 ttccaaagca gttaaggaat gggaacagag 
ctctctcttt ctctcttttt ttt 



ttaaaggacc tctgccgcct cagaccttgc 60 
atgcagtccc tgatgcaggc tcccctcctg 12 0 
gcgcaagccc acctgaaaaa gccatcccag 180 
gaagggaagg accctgcggt gatcagaagc 24 0 
cctggaaatg tgaccctcag tgtcgtgggc 300 
aaggtggatt tagttttgga gaaggaggtg 360 
gactacattg gcagctgtac ctttgaacac 420 
actggggagc cctgcccaga gcccctgcgt 480 
aaagaaggaa cctactcact gcccaagagc 540 
agttggctca ccaccgggaa ctaccgcata 600 
ctgggctgca tcaagatcgc tgcctctcta 660 
agaatggagc ggtgtgagga aggtcccttt 720 
tcccactctc tgcccccctt taatcccctt 780 
atcattttgt accacttaca ttttaggctg 840 
agttggacag ttcttgatag cccagggcat 900 
ttaacattct ctctaaagag cctcgttcat 960 
tgttttagga cctgaagaat ctttatgact 1020 

1043 



<210> 42 
40 <211> 342 
<212> ADN 

<213> Homo sapiens 
<400> 42 

45 atgacntgya aratgwsnca rytngarmgn 
cartaywsng tnaarytngg ncayccngay 
gtnmgnaarg ayytncaraa yttyytnaar 
cayathatgg argayytnga yacnaaygcn 
atgytnatgg cnmgnytnac ntgggcnwsn 

50 ccnggncayc aycayaarcc nggnytnggn 



aayathgara cnathathaa yacnttycay 60 
acnytnaayc arggngartt yaargarytn 120 
aargaraaya araaygaraa rgtnathgar 180 
gayaarcary tnwsnttyga rgarttyath 24 0 
caygaraara tgcaygargg ngaygarggn 300 
garggnacnc cn 342 



<210> 43 
<211> 4195 
55 <212> ADN 

<213> Homo sapiens 



<400> 43 
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ttccaccttt tggctcttgt aaataacgct 
tgaatccctg cattcaattc ttttgcatat 
gtaattctgt gttcatttat ttgaggaaca 
ttttacattc ccactaacag tgcattaggc 
5 gttttctggg ttttaaaaga agtagtagtc 
gtcgttttgc ttcatgtttt cctaaagatt 
tatatcttct tcggagaagt gtctatttga 
ttttttgttg ttgagttgta gggattcttt 
atttgtttta caaatatttt ctttgtaaca 

10 aagccagtta atctgagtag cattttgtta 
atcctgggga attggccacc tcctcttctc 
caaagaactc ttcccctcca ctacctcaga 
ggggtcccag acacaataat taaccaagag 
aatggctcag gcccttgtga agtgccgagg 

15 tggtccatcc ccagctttca cagaacagga 
ggaatggata tagcccttgg caacaacaca 
aacaacgata gttttagttt ttagtaatga 
agccaggaca ctgttctcaa cccttttgcg 
gccatggagg aatgttctca ctgagtgcat 

20 cagtttcagg gatgtatggc ctgaccacca 
gagggcatgg gagtgggaat ctggctggat 
agagcccccc tacctgcttt ttccttcctg 
ttccgcttct cctacctccc cacccaaaat 
ctggttgaga aacagagact gtagcaactc 

25 aagctgtggg cagctggcca agcctaaccg 
atgtctcttg tcagctgtct ttcagaagac 
gcactttggg cttctcttgg ggagggtcag 
agagaaagct cagggaggtc tggagcaaag 
ataaggaagg agagtatcct ccagcacctt 

30 ctggactttt cttgagcaga gggtggggtg 
tgcacatgtc tctgtgtgaa tggacccttc 
acccttccca ccagaggcca tagccatctg 
gacaaggcca tcgcttgggg catgaatcct 
cctgccatgg gattccccag aaggttctgt 

35 atgttgaccg agctggagaa agccttgaac 
ctgataaagg ggaatttcca tgccgtctac 
gagtgtcctc agtatatcag ggtgaggagg 
tcctggggct gccctgggcc agcggtcctc 
gctctctctg agatctttaa actctggctt 

40 gcagacgtct ggttcaaaga gttggatatc 
ttcctcattc tggtgataaa gatgggcgtg 
cacaaagagt agctgagtta ctgggcccag 
ataataaagt catcaatacc tcatgcctct 
99tgtggagg gagggttgga aaacccaaag 

45 tacctctcac aagcctttcc tgctttaccc 
gcccctcatt tcgagcattg gatttgaggc 
gctgatgatt ttatagtggt tctgaaatgg 
aagaacaact gatactgttc tctaagctaa 
tggctcttgg gaaccttaga gtgatagcta 

50 tctgtgtgtg tgtgtgtgag agagagacag 
agaggctgat tgtgtgtgtg gtgtgatgta 
aggataatcc tcacacctgt ccacatacct 
ttcctccctc tccactccca aactcccaac 
ggaaaataaa ttagtaaaac ttaagtcaaa 

55 ttctatgctt tgtgatcaga aaattatcta 
aggccagaag acgagtggtt cttctctgag 
ggaacctttt gacaagaatg tcaccccaaa 
ttctgttgtc ctcacttagg tgctggggca 



gctatgaaca tgaatgtaca aacatctgtt 60 
atacccagga gcagaatgat ggatcatatg 120 
aacttgccgt tttccataac agctgcacta 180 
ttccaattct ctatgccctc accaacactt 240 
atccttgtag gtgtcaggtg gtatctcatt 300 
agtaattttc atatgcttat tgaccatttg 360 
gtctttcccc aattttgatt ggtttgtttg 420 
tatattctgg atattaatcc cttatcagat 480 
acagaaacac accacagtct tcaaggttgg 54 0 
gtggtgggga gaggatttgt tcctcctgaa 600 
ctcttaggca tgaagcgcgt ctggcttctc 660 
gttagcttcc tctcttcagc cagtgatcct 720 
agggtgaaag gctccctgct gtgtttatgc 780 
gaccccaagc agcctccatc tcccagggca 840 
aagctgtgga ggagtgtggg cagcagggta 900 
tttccccaca aagcacccac ccaaaagaac 960 
gaacaatagt tctcatgact aaaagccatc 1020 
gtctttggac cctttgaaac tctgacagaa 1080 
gcactcaaaa tgatgcattc aacttcaatt 1140 
atgcagggga ttagcaatcg caatagtgga 1200 
caagcaagtg gatgccagca gcccagaaaa 1260 
ggcactattg cccagcaaat gccttcctct 1320 
tttcattctg cacagtgatt gccacattca 1380 
tggcagggag aagctgtctc tgatggcctg 1440 
ctataaaaag gagctgcctc tcagccctgc 1500 
ctggtaagtg ggactgtctg ggttggcccc 1560 
ggaagtggag cagccttcct gagagaggag 1620 
atactcctgg aggtggggag tgaggcaggg 1680 
ccagtgggta agggcacatt gtctcctagg 1740 
gtaaggaaag tctacgggcc cccgtgtgtg 1800 
cccttcccac acgtgtatcc ctatcatccc 18 60 
ctggtttggt tatttgagag tgcaggccag 1920 
ctgcgtactg ccctggccag atgcaaattc 1980 
ttttcaggtg gggcaagttc cgtgggcatc 2040 
tctatcatcg acgtctacca caagtactcc 2100 
agggatgacc tgaagaaatt gctagagacc 2160 
ggctgggtgt ggcgggggct ctctgcctgg 2220 
cctgccaccc ttcatagatg ctatgcctcg 2280 
cttcctcctc aatcttgaca gaaaaagggt 2340 
aacactgatg gtgcagttaa cttccaggag 24 00 
gcagcccaca aaaaaagcca tgaagaaagc 24 60 
aggctgggcc cctggacatg tacctgcaga 2520 
ctcttatgct tttgtggaat gaggttcctc 2580 
gaagaaaaag aaatctatgt tatcccaccc 264 0 
ctcacctggc ctctgcccca cattccttca 2700 
ttaaggattc aaaaagtcgt catgaatata 2760 
gtcggggatt tgggaacagg gtggtagtat 2820 
atcttagctt ccagctacct gtcttagatg 2880 
catagaagtg tgtgggtgtg tgtgtgtgtg 2 940 
acagaaagag agcaagagag ggaagggggg 3 000 
ggtggacaat gttcagagtc ctccattaac 3 060 
gtagtttgtc cttggggatt ttgaaaattt 3120 
tcaattaaat gataaaggaa taggcaaata 3180 
gaataggtta ttcatacgct gcctatggga 3240 
aaaaatactt cccaagggct ggtacaaggg 3300 
gtggacatta aaaaaagaag aaaatgaagg 3360 
ctggattttc atgctgtggt gtggggaatt 3420 
gtggtgttag tgatgggtaa aaaggtagga 3480 
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agctgtcaca gaatcactaa accagggttc 
tgggttgaag ttgtgtgcat cattttgagt 
catcgagagt ctcgaaaagg cccaacacct 
ctggttttta gtaacaaatg gcagagtatt 
5 tttttttgag acacagggtc ttgtctgtca 
gggctcactg tagcctcgaa cacctgggct 
tagctgggac tacagcatga gccactgccc 
agatggaaac ttgctatgtt gcccaggcta 
ctaccttggc ctcccaaagt gctgagatta 
10 attggagtat ttttattgct attgttgtgc 
ggacgtgtgt tgttgccaag ggctaaatca 
agctttcctg ctctgtgaag ctaaggatac 



ttaacttgtc tgtctataca tctctgaaat 3540 
gacgcactga gaacattcct ccacggcttc 3600 
caaaaaggtt aagaacactt gtcctgctta 3660 
tctctctgtc tctctctctt tttttttttt 3720 
cgtggactag agtacaatgg gcatgatcat 3780 
caagtaatcc tcccacctca gcctctttag 3840 
ttggctaatt tttaaattat ttttttgtag 3900 
gtctcaaact cctggactca agcgatcctc 3960 
cagtgtgatc cacaccacac ctggccaaag 4020 
tgggtgggtg ggtgggtgta tgctttgtgg 4080 
gttcctaccc tgctgcccac agtcctccac 4140 
accccgatga taagctgtca acata 4195 



15 <210> 44 
<211> 477 
<212> ADN 
<213> Homo sapiens 

20 <400> 44 

tttttttttt ttttttttgg ataaagactt atttattatt tatcttatca tttcccagaa 60 
caaaggccat tgagtaagcc attcccttta aacttggttg ggcagctgtc acatggctga 120 
cctcttaatt acttcccaca gcctttgcca tgactgtggc catgcccacg tgggttgttc 180 
tcatgcagct tctcatgaca ggcaaagatc aactttgcca tcagcatcat acactcctca 240 
25 aagctcagct gattgtcctg gtttgtgtcc aggtcctcca tgatgtcatt tatgagggct 300 
tcatttctct tctctttctt cataaaaggt tgccaaactg tgcttcccac catttggtct 360 
-gaattccttc ttgctcaggg ' tgtaggggng ggtcttcctt cttaaagtat tgatgaaagg 420 
gggccagatg ggggggttat gctgcgctcc atctgaaaag tggctttggt gggccat 477 

30 

<210> 45 

<211> 406 

<212> ADN 

<213> Homo sapiens 

35 

<400> 45 

tttttttttt tttttttttt ttttggagga agagacttta tttggcccca gcccctagcc 60 
ccacagccaa gacagtttga cataacaggc cccggggccc tggttgggta gaggcagggt 120 
ggcctggcct cctgattagt ggctgtggcc gtggccacca tgactgtggc cgtggccggg 180 
40 gccactgtga tcttggccac tgtggtctta gggggtgccc tccccgaggc ctggcttatg 24 0 
gtggtggcca gggccctcgt caccctcgtg cattttttcg tgggaggccc aggttagcct 300 
cgccatcagc atgatgaact cctggagctc agctgcttgt ctgcatttgg gtccaggtcc 360 
tccatgatgt gttctatgac cttttcattc ttattctcct tcttga 406 

45 

<210> 46 

<211> 425 

<212> ADN 

<213> Homo sapiens 

50 

<400> 46 

ggaggaagag actttatttg gccccagccc ctatccccac agccaagaca gtttgacata 60 
acaggccccg gggccctggt tgggtaaagg cagggtggcc tggcctcctg attagtggct 120 
gtggccgtgg ccaccatgac tgtggccgtg gccgtggcca ctgtgatctt ggccactgtg 180 
55 gtcttagggg gtgccctccc cgaggcctgg cttatggtgg tggccagggc cctcgtcacc 240 
ctcgtgcatc ttctcgtggg aggcccaggt tagcctcgcc atcagcatga tgaactcctc 300 
gaagctcagc tgcttgtctg catttgtgtc caggtcctcc atgatgtgtt ctatgacctt 360 
ttcattctta ttctccttct tgagaaaatt ttgcagatct tttcgcacca gctcttngaa 420 
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ttCCC 425 



<210> 47 
5 <211> 565 
<212> ADN 

<213> Homo sapiens 
<400> 47 

10 aattcgcccg gctttgacag agtgcaagac gatgacttgc aaaatgtcgc agctggaacg 60 
caacatagag accatcatca acaccttcca ccaatactct gtgaagctgg ggcacccaga 120 
caccctgaac cagggggaat tcaaagagct ggtgcgaaaa gatctgcaaa attttctcaa 180 
gaaggagaat aagaatgaaa aggtcataga acacatcatg gaggacctgg acacaaatgc 240 
agacaagcag ctgagcttcg aggagttcat catgctgatg gcgaggctaa cctgggcctc 3 00 

15 ccacgagaag atgcacgagg gtgacgaggg ccctggccac caccataagc caggcctcgg 3 60 
ggagggcacc ccctaagacc acagtggcca agatcacagt ggccacggcc atggccacag 420 
tcatggtggc cacggccaca ggccactaat caggaggcca ggccaccctg cctctaccca 4 80 
accagggccc cggggcctgt tatgtcaaac tgtcttggct gtggggctag gggctggggc 540 
caaataaagt ctcttcctcc aagct 565 

20 

<210> 48 
<211> 430 
<212> ADN 
25 <213> Homo sapiens 

<400> 48 

gacttggagg aagagacttt atttggcccc agcccctagc cccacagcca agacagtttg 60 

acataacagg ccccggggcc ctggttgggt agaggcaggg tggcctggcc tcctgattag 120 

30 tggctgtggc cgtggccacc atgactgtgg ccgtggccgt ggccactgtg atcttggcca 180 

ctgtggtctt agggggtgcc ctccccgagg cctggcttat ggtggtggcc agggccctcg 240 

tcaccctcgt gcatcttctc gtgggaggcc caggttagcc tcgccatcag catgatgaac 300 

tcctcgaagc tcagctgctt gtctgcattt gtgtccaggt cctccatgat gtgttctatg 360 

accttttcat tcttattctc cttcttgaga aaattttgca gatcttttcg caccagctct 420 

35 ttgaattccc 430 



<210> 49 
<211> 305 
40 <212> ADN 

<213> Homo sapiens 

<400> 49 

tgacttggag gaaaaaactt tatttggccc cagcccctag ccccacagcc aaaacagttt 60 
45 gacataacag gccccggggc cctggttggg tagaggcagg ggggcctggc ctcctgatta 120 
gtggctgtgg ccggggccac catgactgtg gccggggccg gggccactgt gatcttgcca 180 
ctggggtctt agggggtgcc ctccccgagg cctggtttat ggtggtggcc agggcccttg 240 
tcacccttgt gcattttttc gtgggaggcc caggttagcc tcgccatcag catgatgaac 300 
tcctc 305 

50 

<210> 50 
<211> 452 
<212> ADN 
55 <213> Homo sapiens 



<400> 50 

ggaggaagag actttatttg gccccagccc ctagccccac agccaagaca gtttgacata 60 
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acaggccccg gggccctggt tgggtagagg cagggtggcc tggcctcctg attagtggct 120 

gtggccgtgg ccaccatgac tgtggccgtg gccgtggcca ctgtgatctt ggccactgtg 180 

gtcttagggg gtgccctccc cgaggcctgg cttatggtgg tggccagggc cctcgtcacc 240 

ctcgtgcatt ttctcgtggg aggcccaggt tagcctcgcc atcagcatga tgaactcctc 300 

5 gaagctcagc tgcttgtctg catttgtgtc caggtcctcc atgatgtgtt ctatgacctt 360 

ttcattctta ttctccttct tgagaaaatt ttgcagatct tttcgcacca gctctttgaa 420 

ttccccccgg ttcagggtgt ctgggtgccc ca 452 

10 <210> 51 

<211> 4439 
<212> ADN 

<213> Homo sapiens 
15 <400> 51 

atcactgtgg agtaggggaa gggcactcct ggggtggcaa ggtgggaggt gggccctgtg 60 
ttcccacagt gggcagggag gtagtgaaag ggaagctggc cggacaggaa gggccattcc 120 
aagagggctt tgtgcgcagg gctaagccaa gctttctcca taggcaatgg ggagcaactg 180 
gaggttcgta gcaggagaag gacacatcaa gcccaccagg aggctaagta aaaacagttg 240 

20 tctcccaagt tataagttcc tggaaccctt gctgggagca ggatttagaa aaatgatgct 300 
gagagatgct agaaacatat tcgccctgag gctctctcac tcagactgca agaggaaggt 360 
atcatcagaa ttgcccttaa ccaggaacca gaatagctgg gtccccttcc tgccaagtca 420 
gcaaccagct atgtgacctt gctcaggtcc atctccgggt gtcagtttct tcatctacaa 480 
tgcaagaggg ttgcccacct ctgagaaccc ttctaacccc aaatctcacc ctatgaatct 540 

25 aagaacacaa cccctcgcca tcctaagtat cacagagcca ggcaagcatg ggtgagagct 600 
cagaccatcc ttgttggact aaaaggaagg ggcagactgc catggggggc agccgagagg 660 
gtcaggcccc cataggtcct cagcctgctt caacctcaaa ggggatgggg ggctgagtgg 720 
tgccagagga gcagcaggct cgctcgggga gagtagggcc ttaggataga agggaaatga 780 
actaaacaac cagcttcctg caaaccagtt tcaggccagg gctgggaatt tcacaaaaaa 840 

30 gcagaaggcg ctctgtgaac atttcctgcc ccgccccagc ccccttcctg gcagcattag 900 
cacactgctc acctgtgaag caatcttccg gagacagggc caaagggcaa gtgccccagt 960 
caggagctgc ctataaatgc cgagcctgca cagctctggc aaacactctg tgtggctcct 1020 
cggctttggt aagtgagctg ccagcttccc caggcagaag cctgcctgcc gattccttct 1080 
ttccttccct gacccaactt ccttccaaat cctcctccta gaagccctcc ttggttggcc 1140 

35 ctgcctactt taaagcttct ttcacatttt cttaggtcat gttcccctgg ggcctcctgc 1200 
cctcaaatgc tttgcttttt ggcactctgt agatattcta aaaaatcatt ttgtacatgt 1260 
gtgtgacagg ccatctccca gttaagttgc agcctgtgct ttctttttat tttgcacttc 132 0 
ccccactatt tctgtgagtg cttagtagga agtgtcaaag aagcttgaca gcattttctt 1380 
ctaagtgtcc caactcttgg ttttccatta cacagacaga gtgcaagacg atgacttgca 144 0 

40 aaatgtcgca gctggaacgc aacatagaga ccatcatcaa caccttccac caatactctg 1500 
tgaagctggg gcacccagac accctgaacc agggggaatt caaagagctg gtgcgaaaag 1560 
atctgcaaaa ttttctcaag gtagggctgg actctggcag gtctgaccca gcctcaccgc 1620 
agtttgggtt gacaagggag gatgggagta tgggctacag caatcaaggg gaagatttga 1680 
gctcctggag cccagcccca agacgcagcg agtgtcctgt tatacagggc aggtgctcac 1740 

45 agttacacag gacgacaggg tcaagaaatt gctcaattga acacctgcta tttgtcgggc 1800 
cctgttctgg gcagagggat gtagtggtaa atgggagccc actattccat gaggagacac 1860 
acagtaaagc tgttggccaa taaagagcac agataaagcc aaatgccaat aagtgcctgg 1920 
aagaaaatga gatagagtgc gctgtgggca atggggctgg gtggggtgga ggtgaccagt 1980 
tagggtacat gagaagggcc tcttt-.gagga ggtaacattt gagctgagcc ccgaatgttg 204 0 

50 gggagggaag cccctgagga tgacacttgg cacaaagctg aggagaccct aagcctcagg 2100 
gcgaacttgg ggtggaagac ttgggggctt ttctaatcct aagggtctgc ggtggaaaat 2160 
gaatgcataa agagcacatg gagagcacct gcacagcact cagggaactg ggaggttttt 222 0 
cccccgctcc aaaaatgatt aggcagttct aagaaaaagg ctgagcactt ccaacagcct 2280 
ttttgttttc ttttcaaatt tggggaaagt cgggaaacag aggcctgcat taagaagggt 2340 

55 ggaacacatg ggtctcagtc tcagttccag tcccggagcc agacatcctg gggtaggtcc 2400 
ccagccctcc cagtgcccct ccctccgcct tggtaaggtg gagaattgca gccttcagag 2460 
ttaggggccc tgacagctct ccataggtgg aggcctcagg caggcaggat gctgggtggg 2520 
gtaggcaaga aagggcccag cagagaggcc gcatcggaaa actatcctcc atgtgacccc 2580 
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ctatgcccgc ttcacccccc acctgacacc 
aaggaagcag agcctcatgg atgggctgca 
cacaggttct gggaggggac ttagcgaggt 
ggattacaag catgagccac cctgtccgac 
5 tgaggtcagc ggagcacata ctctgctctc 
gtttttctag cgtttccccg ttgtattggt 
agagggaagg gaagggaggg caggggaagg 
ctggcctcta agtcagatct gaatttgcat 
tgaccctctc taggactggt ttcaagtctt 

10 aagttgttat aaggaccaaa tgaggtgaca 
caagaccctg gaactcagct tcctcttcta 
gtcatggagg gaataaactg gagagcgttt 
gcactcagcc tatggtcatt tttaattttt 
tacatttgcc agctggtcat ttactgtgct 

15 ctcacagcct tctctcccca cccgcagaag 
atcatggagg acctggacac aaatgcagac 
ctgatggcga ggctaacctg ggcctcccac 
ggccaccacc ataagccagg cctcggggag 
cacagtggcc acggccacgg ccacagtcat 

20 aggccaggcc accctgcctc tacccaacca 
tggctgtggg gctaggggct ggggcaaata 
gcttcttcca cctcttctcc aaccctgcct 
tccttatctg tgactcagcc ccctcattca 
gggtctgtgc tgggcccctt ggctcacctc 

25 ccccactgtt cagatcccag gctccctgcc 
gcctgacaaa tggcccttgt cactgtacac 
cttgatatgc ctgctacctc accaaccagc 
cacagccctc tctctctcct aacagaattc 
ctagatagtg ccatgtctgg ggaggaatat 

30 ggtgtgttat ctcacatttg atcagagagc 
atcaacggga gtgctcacac aagtgggagt 



ccccaccaga agcaaagcga tgctgtggga 2640 
caggagagtg ctcgcattgg ctgggtaccc 2700 
gactcagtgc ctcggcctcc caaagtgctg 2760 
catctcccct tttatacttt atcacaccct 2820 
tgacccccca tctcccctgc ccacacctag 2880 
tgaaataagt ttcactaatt ggtaacctcc 2940 
agtgaagtgc agaggggtag cagagtggaa 3000 
gccctcaata gtcaagcctg tgaaaactaa 3060 
cctccaggaa gataccattc ctagctgtta 3120 
tttccaggct tactcatgcc atgaccaggg 3180 
taaatagaga atcagcaccc aagtcacagg 3240 
ggtatgtgct cagtgtctgc tccattgtgc 3300 
aaatccagcc ccagggtcga ggcttccttg 3360 
cccagtcccc acctctggcc acacccagct 3420 
gagaataaga atgaaaaggt catagaacac 3480 
aagcagctga gcttcgagga gttcatcatg 354 0 
gagaagatgc acgagggtga cgagggccct 3600 
ggcaccccct aagaccacag tggccaagat 3660 
ggtggccacg gccacaggcc actaatcagg 3720 
gggccccggg gctgttatgt caaactgtct 37 80 
agtctcttcc tccaagtcag tgctctgtgt 3840 
tcccagggct ctggcattta gacagccctg 3900 
gtattaacaa aatgagaagc agcaaaacat 3960 
cctgaccatg tcctcacctc tgacttcagg 4020 
ccatctcaga caccctgtcc agcctgtcca 4080 
tgtagaaagc aaaaaggcat atctctaccc 4140 
cccaagcctg tcttcaccca tcactgtcta 4200 
tattcctctg aaagtcttca gaaactggac 4260 
ggcaccaggc agtggaaaca aggacagatc 4 320 
atgatctctc ttaacagacc tgccacccta 4380 
ctgagagctt agccctatgc ccaccctgg 4439 



<210> 52 
35 <211> 565 
<212> ADN 
<213> Homo sapiens 

<400> 52 

40 aattcgctcg gctttgacag agtgcaagac gatgacttgc aaaatgtcgc agctggaacg 60 
caacatagag accatcatca acaccttcca ccaatactct gtgaagctgg ggcacccaga 120 
caccctgaac cagggggaat tcaaagagct ggtgcgaaaa gatctgcaaa attttctcaa 180 
gaaggagaat aagaatgaaa aggtcataga acacatcatg gaggacctgg acacaaatgc 24 0 
agacaagcag ctgagcttcg aggagttcat catgctgatg gcgaggctaa cctgggcctc 3 00 

45 ccacgagaag atgcacgagg gtgacgaggg ccctggccac caccataagc caggcctcgg 360 
ggagggcacc ccctaagacc acagtggcca agatcacagt ggccacggcc atggccacag 420 
tcatggtggc cacggccaca ggccactaat caggaggcca ggccaccctg cctctaccca 480 
accagggccc cggggcctgt tatgtcaaac tgtcttggct gtggggctag gggctggggc 54 0 
caaataaagt ctcttcctcc aagct 565 

50 

<210> 53 
<211> 255 
<212> ADN 
55 <213> Homo sapiens 

<400> 53 

gayaayggng aygtntgyca rgaytgyath caratggtna cngayathca racngcngtn 60 



WO 01/05422 



52 



PCT/FR00/02057 



mgnacnaayw snacnttygt ncargcnytn gtngarcayg tnaargarga rtgygaymgn 120 
ytnggnccng gnatggcnga yathtgyaar aaytayathw sncartayws ngarathgcn 180 
athcaratga tgatgcayat gcargaycar carccnaarg arathtgygc nytngtnggn 240 
ttycgygayg argtn 255 

5 

<210> 54 
<211> 2724 
<212> ADN 
10 <213> Homo sapiens 

<400> 54 

cgcgctatgt acgccctctt cctcctggcc agcctcctgg gcgcggctct agccggcccg 60 
gtccttggac tgaaagaatg caccaggggc tcggcagtgt ggtgccagaa tgtgaagacg 120 
15 gcgtccgact gcggggcagt gaagcactgc ctgcagaccg tttggaacaa gccaacagtg 180 
aaatcccttc cctgcgacat atgcaaagac gttgtcaccg cagctggtga tatgctgaag 240 
gacaatgcca ctgaggagga gatccttgtt tacttggaga agacctgtga ctggcttccg 300 
aaaccgaaca tgtctgcttc atgcaaggag atagtggact cctacctccc tgtcatcctg 360 
gacatcatta aaggagaaat gagccgtcct ggggaggtgt gctctgctct caacctctgc 42 0 

20 gagtctctcc agaagcacct agcagagctg aatcaccaga agcagctgga gtccaataag 4 80 
atcccagagc tggacatgac tgaggtggtg gcccccttca tggccaacat ccctctcctc 540 
ctctaccctc aggacggccc ccgcagcaag ccccagccaa aggataatgg ggacgtttgc 600 
caggactgca ttcagatggt gactgacatc cagactgctg tacggaccaa ctccaccttt 660 
gtccaggcct tggtggaaca tgtcaaggag gagtgtgacc gcctgggccc tggcatggcc 720 

25 gacatatgca agaactatat cagccagtat tctgaaattg ctatccagat gatgatgcac 780 
atgcaaccca aggagatctg tgcgctggtt gggttctgtg atgaggtgaa agagatgccc 84 0 
atgcagactc tggtccccgc caaagtggcc tccaagaatg tcatccctgc cctggaactg 900 
gtggagccca ttaagaagca cgaggtccca gcaaagtctg atgtttactg tgaggtgtgt 960 
gaattcctgg tgaaggaggt gaccaagctg attgacaaca acaagactga gaaagaaata 1020 

30 ctcgacgctt ttgacaaaat gtgctcgaag ctgccgaagt ccctgtcgga agagtgccag 1080 
gaggtggtgg acacgtacgg cagctccatc ctgtccatcc tgctggagga ggtcagccct 1140 
gagctggtgt gcagcatgct gcacctctgc tctggcacgc ggctgcctgc actgaccgtt 1200 
cacgtgactc agccaaagga cggtggcttc tgcgaagtgt gcaagaagct ggtgggttat 1260 
ttggatcgca acctggagaa aaacagcacc aagcaggaga tcctggctgc tcttgagaaa 1320 

35 ggctgcagct tcctgccaga cccttaccag aagcagtgtg atcagtttgt ggcagagtac 1380 
gagcccgtgc tgatcgagat cctggtggag gtgatggatc cttccttcgt gtgcttgaaa 144 0 
attggagcct gcccctcggc ccataagccc ttgttgggaa ctgagaagtg tatatggggc 1500 
ccaagctact ggtgccagaa cacagagaca gcagcccagt gcaatgctgt cgagcattgc 1560 
aaacgccatg tgtggaacta ggaggaggaa tattccatct tggcagaaac cacagcattg 1620 

40 gtttttttct acttgtgtgt ctgggggaat gaacgcacag atctgtttga ctttgttata 1680 
aaaatagggc tcccccacct cccccatttc tgtgtccttt attgtagcat tgctgtctgc 174 0 
aagggagccc ctagcccctg gcagacatag ctgcttcagt gccccttttc tctctgctag 1800 
atggatgttg atgcactgga ggtcttttag cctgcccttg catggcgcct gctggaggag 1860 
gagagagctc tgctggcatg agccacagtt tcttgactgg aggccatcaa ccctcttggt 1920 

45 tgaggccttg ttctgagccc tgacatgtgc ttgggcactg gtgggcctgg gcttctgagg 1980 
tggcctcctg ccctgatcag ggaccctccc cgctttcctg ggcctctcag ttgaaccaaa 2040 
gcagcaaaac aaaggcagtt ttatatgaaa gattagaagc ctggaataat caggcttttt 2100 
aaatgatgta attcccactg taatagcata gggattttgg aagcagctgc tggtggcttg 2160 
ggacatcagt ggggccaagg gttctctgtc cctggttcaa ctgtgatttg gctttcccgt 2220 

50 gtctttcctg gtgatgcctt gtttggggtt ctgtgggttt gggtgggaag agggcccatc 2280 
tgcctgaatg taacctgcta gctctccgaa gccctgcggg cctggcttgt gtgagcgtgt 2340 
ggacagtggt ggccgcgctg tgcctgctcg tgttgcctac atgtccctgg ctgttgaggc 24 00 
gctgcttcag cctgcacccc tccctttgtc tcatagatgc tccttttgac cttttcaaat 2460 
aaatatggat ggcaagctcc taggcctctg cttcctggta gagggcggca tgccgaaggg 2520 

55 tctgctgggt gtggattgga tgctggggtg tgggggttgg aagctgtctg tggcccactt 2580 
gggcacccac gcttctgtcc acttctggtt gccaggagac agcaagcaaa gccagcagga 2640 
catgaagttg ctattaaatt gacttcgtga tttttgtttt gcactaaagt ttctgtgatt 2700 
taacaataaa attctgttag ccag 2724 
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<210> 55 
<211> 2171 
5 <212> ADN 

<213> Homo sapiens 

<400> 55 

cgcgctatgt acgccctctt cctcctggcc agcctcctgg gcgcggctct agccggcccg 60 
10 gtccttggac tgaaagaatg caccaggggc tcggcagtgt ggtgccagaa tgtgaagacg 120 
gcgtccgact gcggggcagt gaagcactgc ctgcagaccg tttggaacaa gccaacagtg 180 
aaatcccttc cctgcgacat atgcaaagac gttgtcaccg cagctggtga tatgctgaag 240 
gacaatgcca ctgaggagga gatccttgtt tacttggaga agacctgtga ctggcttccg 300 
aaaccgaaca tgtctgcttc atgcaaggag atagtggact cctacctccc tgtcatcctg 360 

15 gacatcatta aaggagaaat gagccgtcct ggggaggtgt gctctgctct caacctctgc 420 
gagtctctcc agaagcacct agcagagctg aatcaccaga agcagctgga gtccaataag 480 
atcccagagc tggacatgac tgaggtggtg gcccccttca tggccaacat ccctctcctc 540 
ctctaccctc aggacggccc ccgcagcaag ccccagccaa aggataatgg ggacgtttgc 600 
caggactgca ttcagatggt gactgacatc cagactgctg tacggaccaa ctccaccttt 660 

20 gtccaggcct tggtggaaca tgtcaaggag gagtgtgacc gcctgggccc tggcatggcc 720 
gacatatgca agaactatat cagccagtat tctgaaattg ctatccagat gatgatgcac 780 
atgcaaccca aggagatctg tgcgctggtt gggttctgtg atgaggtgaa agagatgccc 840 
atgcagactc tggtccccgc caaagtggcc tccaagaatg tcatccctgc cctggaactg 900 
gtggagccca ttaagaagca cgaggtccca gcaaagtctg atgtttactg tgaggtgtgt 960 

25 gaattcctgg tgaaggaggt gaccaagctg attgacaaca acaagactga gaaagaaata 1020 
ctcgacgctt ttgacaaaat gtgctcgaag ctgccgaagt ccctgtcgga agagtgccag 1080 
gaggtggtgg acacgtacgg cagctccatc ctgtccatcc tgctggagga ggtcagccct 1140 
gagctggtgt gcagcatgct gcacctctgc tctggcacgc ggctgcctgc actgaccgtt 12 00 
cacgtgactc agccaaagga cggtggcttc tgcgaagtgt gcaagaagct ggtgggttat 1260 

30 ttggatcgca acctggagaa aaacagcacc aagcaggaga tcctggctgc tcttgagaaa 1320 
ggctgcagct tcctgccaga cccttaccag aagcagtgtg atcagtttgt ggcagagtac 1380 
gagcccgtgc tgatcgagat cctggtggag gtgatggatc cttccttcgt gtgcttgaaa 1440 
attggagcct gcccctcggc ccataagccc ttgttgggaa ctgagaagtg tatatggggc 1500 
ccaagctact ggtgccagaa cacagagaca gcagcccagt gcaatgctgt cgagcattgc 1560 

35 aaacgccatg tgtggaacta ggaggaggaa tattccatct tggcagaaac cacagcattg 162 0 
gtttttttct acttgtgtgt ctgggggaat gaacgcacag atctgtttga ctttgttata 16 80 
aaaatagggc tcccccacct cccccatttc tgtgtccttt attgtagcat tgctgtctgc 1740 
aagggagccc ctagcccctg gcagacatag ctgcttcagt gccccttttc tctctgctag 1800 
atggatgttg atgcactgga ggtcttttag cctgcccttg catggcgcct gctggaggag 1860 

40 gagagagctc tgctggcatg agccacagtt tcttgactgg aggccatcaa ccctcttggt 1920 
tgaggccttg ttctgagccc tgacatgtgc ttgggcactg gtgggcctgg gcttctgagg 1980 
tggcctcctg ccctgatcag ggaccctccc cgctttcctg ggcctctcag ttgaaccaaa 204 0 
gcagcaaaac aaaggcagtt ttatatgaaa gattagaagc ctggaataat caggcttttt 2100 
aaatgatgta attcccactg taatagcata gggattttgg aagcagctgc tggtggcttg 2160 

45 ggacatcagt g 2171 



<210> 56 
<211> 35465 
50 <212> ADN 

<213> Homo sapiens 

<400> 56 

gatcttggct cactgcaacc tccgcctcca aggttcaagc gatcctccca cctcagcctc 60 

55 ccaagtagct gggattacaa gcgtgtgcta tcacacctgg ctaattttta tatttttggt 120 

agagatgggg tttcaccttg ttggttaggc tggtcttgaa ctcctgacct caggtgatct 180 

gcctgcctca gcctcccaaa gtgctgggat tacaggtgtg agccaccgcg cccagcctga 24 0 

ccctttcttt ctctactggc aaaactcctg ctccttttta aagccaagct catgtcacct 300 
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cctctgtgaa gtcctcgctg actccccaag 
ggcccctgca ctgctctcca tcacaccctg 
ccactgacta tgggctcctt gaaggcaggg 
caatgctggg catgagtcag cctcagaaga 
5 atatctccag cctcaggctg ggacccctcc 
actcaccctc cagagtcttc aatgcccact 
aatcaggtca tcgtccacgg ctaccaggtg 
aagccctttt gcgcccacca tgtcttcacc 
ggcacccagt ggatcctcca tgcccactgc 

10 caccaaatca gcaacaccca acagatcctt 
ctcagtcatg agcccaagca gttccaagtc 
ttctaaccgg cccagcagca ggtcccgagt 
gagcaccgac accaggacca gcaaagccag 
gaggggcaca cacagccggg gtaggacacc 

15 gtcacccagc agggccagca ctcctggcag 
ggccagcagg gtgagaactc ccacttcaca 
ccggcctaga accagcaaca gggaaaggag 
gagttaccgc ccaccaggag gctcaggtat 
cagtacagcc aagtgtcaaa ccccgactgg 

20 atctccatcc tcatcaagga aggtgaagag 
aaagagttac agccccactg aaatgtccag 
ccgcagcagg ccgcaaagtc acagccaatc 
tcagaagagg acgcacagca gagtgagaag 
aagaagtcgc acccggaagg gaattctgag 

25 ccacagcaag gggaaaagtc aaaaccaatc 
ctggtctaga aaccccagca aggaaagaag 
gagagatcac aggggatcta gcagccccag 
ccccaacaag cagagagatc acagccgatc 
ccgatctaga agtccctaca aggcgagaga 

30 gagagattgc agccgatcta gaagtcccta 
tcccaacaag gcaagagatc atagccgatc 
ccgatctaga agccccagca aggaaagaga 
gagagatcac agacgatcta gaagccccag 
ctccagcaaa gagagagatc acagacgatc 

35 acaatctaga agccccaaca aggagagaga 
gagagagcac agacaatcca gaagccccag 
ccccagcaag gagagagagc gcagacaatc 
ccgatctaga agccccaata agcagagtgg 
gaaagctcat agccgatcta gaacccccag 

40 ctctagcaag gagagcgacc ccagtcaatc 
atcccctact aggacaagca gtctcagtca 
ctccccatca acatttccca gtgggggcca 
cgccaccacc tctaaggcca ccttacctgg 
ggcgtagccc ccagtctcag ctggctcacg 

45 gagacaggag cagagcagca gctgagcagc 
acctccggcc acaagttctc taatacagga 
ggggaaagga aagacctgtg atgattcaat 
gcccaactgt gtgctcactg ctggcatggg 
gtctacaggg tcttgactgc aagccctgcc 

50 gagtctctct ctgttgccca ggctggagtg 
ccacctccca ggctcaagca attctcctac 
tgtgcgtcct cacgcccggc taattttgta 
ggccaggctg ggctcgaact cctgacctca 
gctgggatta taggcatgag ccaccgcacc 

55 tgtgggcaac aaggctgcct tctggttctt 
aaatattcaa cagtggggac tggtgtgggc 
gataccaggc cttaaccctt tagttgctgg 
ttatggggaa aaaaaaccct caaactgtgt 



cggtcagtgt ctctctcgta tgggctcccc 360 
accactctgg gcagtggccc ccctccccac 420 
cctgggtctg ccccatctct gtgtccccag 480 
catctgctga atggctgcaa accagaggaa 54 0 
cctctctcct cccacctctg acttcatacc 600 
attacttcac acagttggcc tgtgacaggc 660 
tttcatgtct actgtgactt ccaggaccac 720 
taagagatct tcaaagccca gtatgtctct 780 
ggatcccaag cctcctgcct ccttgaagtc 84 0 
agtgcccacc aaaccagcga catcccgtaa 900 
caccaaatcg accagtacaa aaagagcccc 960 
ccgcagcaaa gcaagaacac ccagcagggt 1020 
caaggccagc gacgtgagat gccaccagcg 1080 
tggcagaagg ggaagccgca gctccaagag 114 0 
gataagaact catggtgcca gaccaggcat 1200 
gcaaaaaggg agccggggaa agagttacgg 1260 
tgacagccag cctagaaatc tgagcaagaa 1320 
agggaggagt tccgagctgg ctgtaactcc 1380 
aattccctcc aaggagaaga gtgacaaccc 1440 
ctacggtcag atgatcatcc ccagtaggga 1500 
cagggtcaag agttataacc aggccagcac 1560 
tagaagcccc agaaggtcaa gaagtggcag 1620 
tcacagttgg aagagaaacc atagcagggc 1680 
ccagatggga agacacagcc agtctagaag 1740 
tagaaccccc agaagaggaa gaagtcacaa 1800 
tcatagccat tccagaagct ccagcaaaga 1860 
gaaggagagt ggtcgcagtc aatcaggaag 1920 
tagaagtccc aacaaggcga gagatcgcag 1980 
tcgcagccga tctagaagtc ccaacaaggc 2040 
caaggcgaga gatcgcagcc gatctagaag 2100 
tagaagtccc aacaaggcga gagatcgcag 2160 
tcacagccaa cttggaagcc ccagcaaaga 2220 
caaggagaga cagtgcagac aatctagaag 2280 
tagaagcccc agcaaggaga gacagcgcag 2340 
tcgcagccaa tctagaagcc ccagcgagga 2400 
caaagagaga gatcgcagac gatggagaag 2460 
tagaagctcc agcgaggaga gagatcacag 2520 
ttacagtcga cctagagcct ccagcaagga 2580 
caaagaagga aatcatagcc aatctagaac 2640 
tacagtcccc agaagtcccg actggaagag 2700 
gaatagaacc cctagcaaga caagcagcca 2760 
aaccctaagc caggatgaca gtcaagccga 2820 
ggaaaggtct tcatcatctt cttccaagct 2880 
ggtctctgtc atgaccgggg gaggggacag 2940 
gtccctcccc ggccagctct ccacagccac 3000 
tgttggcagg tagagaggga tgctggatag 3060 
aaatttttac atagcaccca tccccaccaa 3120 
gcacagagga ccccagctct gtccctgact 3180 
cctctctagg tctttttttt ttttgagaca 3240 
cagtggtgtg atctcagctc actgcaacct 3300 
ctcagcttcc cgagtagctg gaactacaag 3360 
tttttagtag agatggggct tcaccatgtt 3420 
ggtgatccac atgcctcaac ctcgcaaagt 3480 
cgtccccctc tctaggtctt aatttccgca 3540 
attcagtggg gtagggagag gtgacactcc 3600 
accaatcaga actgagagtg gagcgggacg 3660 
accatgggga ggtctggggt tggggaagtg 3720 
ttttcctcta ctctcacact atcacaacaa 3780 
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tcatcaacac agaattctgt gaccaaatgt 
agacaacagc taggtgtccc ctccgattcc 
ttttgtattt ttggaagaga cagggtttca 
cacttcagcc ctccaaagtg ctgggattac 
5 aaaaaataaa aataaggccg ggcgcagtga 
gccgaggtgg gcagatcacc tgagctcagg 
acttgtctct aaaaaaaaaa aaaaaattac 
atagtcccag ctacctgaga ggctgaggca 
ctgcagtgag ccgtgacctt gccactgcac 

10 aaaatttttg ctggagctgc tcacagaact 
tattatagag gatattgcaa agaacaaaga 
aaggggcagg gagcttcacg ccctccctgg 
tagctatgcg gaagctctcc aaacccagtc 
gcagcattgg gcatggactt ctctgaaaag 

15 gaagattaga gtcttgccct ggggcaggaa 
tgtttcttca gacctgcccc aggcctaagg 
aaggctgtag gagttaccag ccaggaactg 
ataccacaag gggggtccaa agtggcagtt 
acaccaaccc atctggaagt attttaatat 

20 tgattatcag ccttagttct gtatcaattg 
agctgtgtag caccaagcaa agaacttaac 
aggggcttcc aggccttaac tcacgtactc 
gtacagatga ggaaacagac acagaggtga 
aagtggatga actaggattg gaagccagac 

25 gtttttctga agattcagta ggctcactga 
atcaagagtg gccattacta ctcccacccc 
cctctcatct ctccctgtgc acacaaggcc 
ctgttgctgt caagaatgtc ctcctcctcc 
actttgttgc ccaggctgga gtacagtagc 

30 gcatcagcct ccctagtagc tgggattaca 
ttttggtatt tttagtagag acagggtttc 
tgacctcagg tgatccattt accttggcct 
accacgccca gccctccttc cccctttttg 
cccaccacaa acataagaac ctctatactt 

35 aagccttctg tgacttctct ctctccctct 
accccaccac acacacacac cactactgtc 
aagcagggcc agttgatgca gcctcagcta 
gggatacaat ggtggaaaat acatggtccc 
gggactaaag agaaaagctt cagattgaaa 

40 gcatcattgg cagggcaact tcctaaagaa 
tttcataatt ggcagaggag aattctaatg 
tttgggaatt ctactttata ccaagataag 
acatccaatt aatttttttg tttgtttttg 
tgttgcgaag gctgctgtca aattcctggc 

45 ttcccaaagt gctgggatta caggcatgag 
atttaatttt cttttttggg acggagtgtc 
gcgatctcgg ctcactgcaa cctctgcctc 
tcccaagtag ctgggactac aggcgcgtgc 
tttttttttt gagacggagt cttgctctgt 

50 cggctcactg caagctccgc ctcctgggtt 
tagctgggac tacaggcgcc tgccaccacg 
tggggtttca ccgtgttagc caggatgatc 
tcggcctccc aaagtgctgg gattacaggc 
tattttttaa gagacagggt ctcgctcagt 

55 gtaggaaagg ggcttccagg ccttaactca 
agctcactgt aacctcaaac tcctgtgctc 
ctgggactac aggtatgcgc caccatgcca 
tttttttgta gagacggggg tctcactata 



gtggggcttt ttccccacac actacacagc 3840 
attccaacgc tgtccccaca cccagctaat 3900 
ccatgttgcc cagagctcaa gcaatctgcc 3960 
aggcgtgagc caccacaccc gactttttta 4020 
cccatgcctg taatcccagc actttgggag 4080 
agtttgacac cagcctaggc aacatggcaa 4140 
aaaagttagc cggtgtggtg gcatgtgctt 4200 
ggaggataaa ttgagcctgg aaggtcaagg 4260 
tcaagcctgg atgacccatc ttacaaaaaa 4320 
caaggaaatg cttacttaga tttactggtt 4380 
tgaagagatg tgtagggcaa ggtataaggg 444 0 
ggtgctaccc tacaggaacc ctcaggtggt 4500 
ctcttgggtt tttacggagg ctttaagaca 4560 
tgtcttaaga ccaacaatca agaaggtggg 4620 
atggagggca ggaggaggtc agagagattc 4680 
tacacaacat tataacaaga gactgtaaca 4740 
tggatgaaaa ccaatatatt tatatatata 4800 
agggacaggg agtacttgtg tagcagtgac 4860 
ttaaacaatt ggtatggcta tactagtttg 4 920 
gcaagatagt gtctaggttt gccacactct 4 980 
ttctctagcc tgtttccttc tctggaagaa 5040 
cccataacta gactgggaat tatctccttt 5100 
taagtgagta gcccaaggtc accatctggt 5160 
ctttcataaa atgatttctc agctcaaaag 5220 
tagaaattgc tggtgtgtgg ctggtattcc 5280 
tgcccctcta taaactccag atgttccaga 5340 
ttttcacatc tgtgggtctt agtacaccca 5400 
tttttttttt tttttttgag atggagtctc 5460 
gcgatctcag ctcactgcaa cctctaccct 5520 
ggcagccacc accaccatgc ccggctaatt 5580 
attatgtcag ccaggctggt ctcaaactcc 5640 
cccagagtgc tgggattaca ggcaagagcc 5700 
gcctggagaa ctccttttca cccttcaaag 5760 
cttgcccgct gaaatactgc ctctgccagg 5820 
tcaccaacgg accgcccccg ccccccacca 5880 
ttccactgta ctccctgaca gtagagaacc 5940 
tatctcttac atgccaaggc ccatgcactg 6000 
ttcaaagtct ggatgtcaag tttaatgctg 6060 
cctggaggtg gctggggcaa aggaccattg 6120 
agcacctaaa tcttggcttt taaagacaga 6180 
ataccctatt gcctacaggg ccccatctaa 6240 
attgccagat ttagcaaata aaaacagaag 6300 
ggtttttgtt gcggagatgg tgtctcacta 6360 
tcaaacaatc ctcctgcctt ggcctcccac 6420 
ctaccacacc tggcccttat ttatttattt 6480 
actctgtcgc ccaggttgga gcgcagtagc 6540 
ctgggttcaa gcgattatcc tgccccagcc 6600 
caccatgccc ggcttttttt tttttttttt 6660 
cgcccaggct ggagtgcagt ggcacgatct 6720 
cacgccattc tcctgcctca gccttccgag 6780 
cccgactatt ttttgtattt ttagtagaga 6840 
tcgatctcct gacctcgtga tccacccgcc 6900 
gtgagccacc gcgcccagcc tacttattta 6960 
tgcccaggct ggagtgcagt agggtgatct 7020 
tgtactcccc cataaccagg ttgggaggtt 7080 
aaggtaccct actagcccct aggagagcag 7140 
ggcttaattt ttactttttt tttttttttt 7200 
ttgcccaggc tggtcttgaa ctcctggtct 7260 
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caagcgatcc tcctgcctta gcctcccaaa 
attaacatag ctatgttcca tgtgatattt 
tcggatataa ttgtttatct gaaattcaaa 
aaccacacac ctgggacaat caagacattc 
5 gcctacactt ttccaagccc acgtcacaca 
gtagggccat cccttggttc acaagtccca 
aaggcaaaca cagtgctgga gaccccacaa 
gatgccccgc gtgaacacaa taggcacccg 
aaaccttcca ctacgggaca ataacggcca 

10 caggatgcct taggcctata gcgaccacct 
gcctccagga cggtcagcgg caggtgtggg 
ggacactctt tcccaggatg caccaggcct 
caaggcggag cgctcggttc tcccaggatg 
aaaaagaagc cctcgggtca ccacggcccc 

15 tcgctcccat catgcagcgg ggccgtagcg 
gcccgggaca ctcaccggcg ccggcggccc 
cccagcctct gcgcctgcgt cgcaagtagg 
ctagggcgct tgcgcggcga gacggactag 
cgcgtcgggc cgtcgacgag acccgcgcgg 

20 ggtttacttg gtacagcccg cggcccaaag 
tgtgcggggc aggaacgcgc cttacaaaac 
tcggactgga tcctgggccc gaggcctgct 
aaggcctccc gcactggaag gagtgatttg 
cgcagtgatt agcatatggc gggggcaacc 

25 gactgacgcg aagtgggtag ccttgtcttc 
gcacgagggc caggacccct cccaaccagg 
gccccatgct ggcggattct gtggtttctg 
cccagtcgaa ggagatacgc acctaattag 
gtgaggaaca cagggggctg tgggagccta 

30 aaagacttcc aggaggtggt gatccttaag 
gaatgggtct ggcagaatga actgcaagcg 
aaaaatagaa gcgcatgttt tgattgagga 
aactggagac gggaaatggt tctatagacg 
gtcttcctgt aagtgacttt gtcacattct 

35 aggaaaaaaa aaaaatccaa aaatctttat 
ccgtgcttat ctttctgacc ccacctactt 
cttaccccaa actctttacc agctcgggcc 
tgcttttccc tctgaccttt gaatacctac 
gatgtcaatc tgagaggctt ttcctgatct 

40 agttatggat aaatcgggat tggccatgag 
acatggggct gggcgcggtg gctcacgccc 
ggtgtatcac ctgaggtcag gagcttgaga 
tctattaaaa ctacaaaaat tagccagggg 
tgggaggctg aggcacgaag atcacttgaa 

45 attgagccac tgcactccag cctgggccac 
ccagcacttt gggaggccga ggcgggcgga 
atcctagacc atttctacta aaaatacaaa 
tggcaggcgc ctgtagtccc agctactcgg 
gggaggcgga gcttgcagtg atccgagatg 

50 gcgagacttg gtctcaaaaa aaagagtaca 
ggtttgaagt tttccataat gacaatggca 
aatagttctt atcacaatct gaactttctt 
aaagcttcat gagggtaaga atggagtcgc 
agcaggatca gatttcagat tagtgtagcg 

55 tattcaccat ggactctaga actttgagca 
taaagttaga ataatacatc taaaatgtac 
ctaaagagct ttgacttggt ctaaaggtga 
aactttaatt caaagttccc ttggagacta 



gtattggtat cactgcaact agcccaaaga 7320 
gggacatact tttctaaaag gttgtatctt 7380 
tttaactaga cattgtatat tttatacggc 7440 
cctgaagtta ccaggagaca atgcccatca 7500 
aggccccttc cagagtattc cagacgtcag 7560 
ctcctaccac gcctatggca gccaaactga 7620 
tgccctgggc ctatagcagt caattcccaa 7680 
ttccaatgct cgagcaaaga gaccagggca 7740 
gttcccacaa ttcgttgtgg cagttcttcc 7800 
tcccagactc cccgtgtgga agcgctccaa 7860 
ataaaaggaa ccggtctcga caaggatctg 7920 
acgactagcg gaccgactcc cacagcgctt 7980 
ccccagggcg gcacaaacgc gtagggggag 8040 
agaccgccgg ctccccggtg acgggagtcg 8100 
cccgcttccc ggcatgcctc gcgcacccct 8160 
ccgctccggc tctgcggcgg cggctgcacg 8220 
gtaggacagc gcgcaggggg cgtgaagagc 8280 
tcctgtagcg ctgtgggaag aggggctatg 8340 
ggggcgccgt gctttgcccc tcgctgcctg 84 00 
gaacaagaag ctgaagggtt cgcgcgtgcg 8460 
tgggatgcgc tgggggtgga gggcgctagt 8520 
tatttgcata atcctagcgc gggacaatga 8580 
catattcccc ggaggggcct tactccagag 8640 
tgagcaaagc gcatgcgcgc agggactgca 8700 
gtaggggatc agtttgcatc ctgagagagg 8760 
ataaaggttt attgatctcc taggtgtcag 8820 
cagtgaacca tactcctgta ctcacggcac 8880 
acaactacta cccagaaggt cagacctgga 8940 
agaggcgctt gccccggcct ctggttctag 9000 
ccaagtacga ataggagcca actagaatgg 9060 
ccaaggccca gaggccaaaa aaaaaaaaaa 9120 
agcaagagca gcttagtatg cctagaacct 9180 
atgttagagt tcaactatgg ctacattcca 924 0 
ggcttaaaac tcccccaaag ggatcccatt 9300 
catggcctca gggctataca cctggtctgg 9360 
cctcctccct ccatttctgt ccagctccac 9420 
tctgctcttg ccgttccctc cgcctgaaaa 9480 
tcttgtgctc accattcata tcttggtaca 9540 
ctccataata gcacttacac atttgactgg 9600 
ttggtggtgg ttgtaactgg catgaagagt 9660 
gtaatcccag cactttggga ggccgaggct 9720 
ccagcctggg caacatggtg aaaccctgcc 9780 
ttatgggggg tgcctgtaat ccttgctact 9840 
ccctggaggc agaggttgca ttgagtcgag 9900 
ccagcgagac tctgggtctc gcctgtaatc 9960 
tcacgtcaga agatcgagac catcctggcc 10020 
aaaaaaaaaa aaaaaattag ccgggcgtgg 10080 
gaggctgagg caggagaatg gcgtgaacac 10140 
gcgctactgc actccagcct gggcgacaga 10200 
tgggacgtta ttgtcctgtc tactcctgtg 10260 
taccacatca ccatactctg catttatatt 10320 
tgcttccttg ttttgagtgt tttcctcatg 10380 
cctttttcac tttgggttct caatgcttag 10440 
ctgtctttaa cacttaacat ttgcctgttt 10500 
gcacctggca catcgtaaga ggttattttt 10560 
atgaatgaat gagaggcctg ggatgccaga 10620 
tggggagcta ggcaaaggtt ttgagagttt 10680 
atgtctgggg tagggggaag ccagggtaag 1074 0 
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ggtccgggcc atggaatggg gtagctcagt 
tggctgaaga aatggccaaa cccaggtttc 
aggaccttct cctggcctat actgtccacc 
ccttagttcc cctcccaatg gtacagccct 
5 aacacttgtt ctctcctcag tttaatggtg 
tcccctcccc accccgtaca aaatgtgtgt 
taacaagaaa aagggggcaa aagccaggaa 
catacagact tttgattttt taatatatta 
cccaaactcc tttccccctc cccggggggc 
10 gagtgggtgg acagagagac aaatatggat 
aaggggagcc caggaacctg gggaaggggg 
cactgccccc atcaaagtta tgacacaaag 
ccacccatcc ccccaccgtg caaacatggc 
actcttacaa tggctggcat ggggtctagg 

15 tgcccccccc acccttccca gaaactgacc 
aggggccctg gccttccccc agttatcttc 
acttgggggg tctggacctt tggcccctgc 
acttctggcc cttacagaga tccaggcatc 
ggtgttagtg gtggggggag aagcccacca 

20 tccttgcagc tggcagtggg ggggacccca 
gatagggtca gatgaagaat tcctctttcc 
cttctcttgc ttctccctgt tcatccaagc 
agggggtgac agacccccgg ggcagggggg 
agtataaggg aagagggaga cagacaagac 

25 gaacacacag ggagaggcag agaaagaggt 
aattaggaag actccaaaag ctcaccgaaa 
tttccttgcc ctgctcccag cgaattcagc 
ccatgctctt tttttcccct aattttttgt 
tgcccaggct ggtctcgacc tcctagcttc 

30 cgtgctggga ttacaggcgt gagccaccgc 
gcttctaaat tctacccctt ttcgagtatt 
ccgcccccgg tgcggcggga tttggaatcc 
ggctctaggc cccgcctctt tccgagccct 
gtcccactca cccttctgcc gtaccgagca 

35 cagaaacacc agcagcgcca ggatgccgcc 
ctctaccacc gcaccagggt ctgccagagg 
cgatcccagt ctggccccat cgctgccaag 
tgccctttta tgtgccacac ccctcaaaaa 
cagatgcttg ttggtttgta cactgcccga 

40 tttctttttc ttgttttctt ttgcagagac 
ttaaactcct gggctcaagc gatcctccgg 
gcgtgagcga ccgcacccag ccatcccttt 
gaaacagagt ccaagaaaca ggtccaagtc 
atttaaagtg ctgggcccaa ctaccaaaat 

45 gaacagctgt gtgctagagc ccattccaac 
acaacagcct tgttatatag gtgctattgt 
ggcgcagaca ggttcggtta cctgcaatag 
ggccagtctg gtcccaaaac aaaaagaact 
gcctctttgc tcaagccccg cccccgccac 

50 gcagcctgct ctcaccgtag accacaagta 
tggacgcctc gcaagtgtag gtgccgttat 
tctctcccac ggcctccgcc ctctccggca 
ggtttggcct gggtggggat aaagtatagt 
attctgactt gtcaagaatc tagacatgca 

55 aggcttcctg ctatctcttt cctttctgga 
atcaccaagg tctcaggaat tctagcccag 
cagcacttta ggaggctgag acgggaggac 
gggcaacaca gggagacccc gtcactacaa 



cgctatcaaa aagacaagac tgtgactatt 10800 
tggggaggtc gaggtaccct cagtgaggtc 1086 0 
agcaaccatc acactcctcc ctcccctctc 10920 
tgacagcagg acagacacac agccacccca 10980 
gttagtgaga ctgccaaacc ccctccccat 11040 
gtggtttttt gttttttgtt ttttgttttt 11100 
tggggagagg ggggtgcaat ctgatatttt 1116 0 
tatataaaac catgaagacc acgaatcctc 11220 
ctggaggaga gatggggaag gcccccccag 11280 
gggacagacg ttgggggaga aggtagagag 1134 0 
attggagaaa agggttgggg ctgtctccct 11400 
acacagaatc cctatttcca cgccctcccc 11460 
tttgcaaaga agtgcccaga gctctgtgga 1152 0 
acccccaaag aaatctgtgt tccccttccc 11580 
ccctccccac aagacctggt tttgtagcct 1164 0 
ccccaaccca atccctactg ccctcactgg 11700 
cccctggggg acccagacct ctgggccctc 11760 
caacaccccc atccctgccc aagcgtctga 1182 0 
tcccagactc tggtaaatgt ctttgctggt 11880 
gcccaggccc aggcctaggc ctggggtggg 11940 
tcttgtgtcc gtcgctgcca ttgaggaagg 12000 
cactggcttc gtgggtcaga taggaacctg 12060 
acatatttgt ggatccagga gttggacaga 12120 
acatgccagg cgaaggaaga gggagaaacg 12180 
aaacagtggc agagaaagag gtaaaagcag 12240 
gtgccaccct tatcctttct cttggaggta 12300 
aattaggaaa ataaattgtt ttattcaaat 12360 
atttttagta gaaaaggggc tgcgccatgg 12420 
tcaagtgctt tatccgcctt ggcctcccaa 124 80 
gcccaaccgc aaatctatgc ttttaattca 12540 
gtgccgaaag ccccgccccc tttgtcatct 12600 
agagcctagg ctccgccctc tcgttaccct 12660 
acaaccaacc aaccgtagag tccaggcccc 1272 0 
ccagaccatg cccactagca cacatatgat 12780 
cacaatggca tagggaaccg acgtctgagc 1284 0 
gacacggcac aggaccaggt catcagagga 12900 
cttttaagcc attctgcaca cgtctaaccg 12960 
ttactgccac cttgtagtct cttctctttc 13020 
cccctcccct gagtcatgtt acattttcct 13080 
gggggtctca ctatgtggcc caggctgatc 13140 
cctaggcctc ccaaagtact gggattagag 13200 
tcttttgact caagtttctt cctccactaa 13260 
ccttcccacc ttgtctaaaa cgctccaagt 13320 
ttctgcccca ccgtcataga gctaaacaca 13380 
caccttacat atttagttca cataatcttc 13440 
ttatttccac tttactgatg ggtaaactga 13500 
aatgcagcca acccgaattt gagccccgcg 13560 
ctgttggctg ccgaacccct gagttatgtg 1362 0 
ctggcgcccc gcccccgccc tcagtcggcc 13680 
cgtagagcgc cctcgcatgg ccgtgcttat 1374 0 
ccgcggatac cagacccggc agcgtgagcg 13800 
aagactcatt cccgcggttc cagcggatct 13 860 
gagagttagg aaccgaggtg ccagcaccca 13920 
actctcatcc cgcagggacc tccaaataag 13980 
aaaccaacag tcctgggcct acttccaccc 14040 
gctgaacatg gtggcttatg cctgcaatcc 14100 
tgcttaaggc cagcagttcc agaccagcct 14160 
ttaaaaaata ataataataa taataataat 1422 0 
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tctagccctc ccacgccatt ccatcctcag 
gtattgggga gtctgagcct ccagattcct 
agatccctat tcgtccaggt ccccagctct 
tagctccctg tttgtccagg tcctcagctc 
5 cctggtccct gttcttccag gtccccagct 
gagctcacct ggggttcccc gtgacagcac 
ccacagcttg ggaggcatga atccgggccg 
agagagtagt ttccaagcca tcacgcagga 
ggcgttggga tcccttgggt cctggcccgc 
10 ctgcgtctgc ttgctgtgtc cggagggcag 
accaccgtcg tccttacggt ccacacgaaa 
gccattttcc tggctgctgc tcactcctgc 
attccggctc catccaccca cccacccgag 
ccacccctta cccacaggcc ccgcctcttg 

15 gcccacgtgc ctcctcccaa agctcttccc 
atccatttaa ttgctatata tataaaaaca 
ctcacaatgt tgggcaggtt gaactcctga 
aaagtgctag gactacaggc gtgagccacc 
gtccagtgtc tgtgaaaacc tgtggctcct 

20 cacctcctcc ccatcccttg tcagcactcg 
ccggtaccag cgcagggtgg cagccggacg 
ctcgccgccc tctaccgcct gctcccggac 
cgcagggaga agggaagtaa ggggttaaag 
gctgcctgtt cccagcgacc atagggaacc 

25 gaggtcagga gccagatgcc catccaggat 
ggagaagaga gaagcagaga agaaaggagg 
tacctagtac cgtgagcgtg gcaatctggt 
aatagccccc ctcgtcctcc aggcgggcat 
agaactcctc aagctggaaa cgctcatcct 

30 tgaatttcgg gagtcctggc ctcacaagtc 
ccctctgcct cttttctcca gccatatcta 
ttgaggaccc agcattattc aagtcctcct 
ccctttcttc tccgagaccc aggagaccaa 
ggagcctggg ccccagccct ctcttccttt 

35 ccacgggtgc cattgaagaa gagggtctgc 
ccatcatact ggtgcagacg gcaggtgatc 
ttctctgtct gtacttcctg tcctgcccct 
acttactgag agctgcaatt caattttttc 
tccctctctt tcccctcatt cattccattg 

40 ggacagggag gaaatctgct ccctactcta 
tgctctaatg agggcagcac agggcacact 
gaattgccta gagagatggg tagccagaga 
gatcttaaag agtaagcagg aggctgagcg 
tgagaggccg aggtgggcgg atcgcaaggt 

45 gtgaaaccct gtcactacta aaaatacaaa 
tgcgcacctg tagtcccagc tactcgggag 
agttggaagt tgcagtgagc cgagatggag 
agactctgtc tcaaaaaaaa aaagaaagaa 
tgggagactg ctgtgtgttc accaagcctc 

50 cgtttgcaaa gatagccgta atattctcct 
ttgccattcc tcccattgag aaggcacttt 
gttgctttga ccaatagaat ttgctagaag 
gtagcttcca ctcctgccct aagactgttg 
gatgaacaat catggtgaaa gagaagccca 

55 tgagtgtggc catcctggat catccagccc 
caagtgaccc cagttgagac caataaaaga 
aaccccagaa tcatgaacaa ataaggtggt 
tctgttctac tgctaaagtt aactgataca 



caaccaggag tctgaggctg cacagcttca 14280 
cctccctcag gatccaggag tccaggtccc 14340 
cccctcctca ggacccagga atccaggtcc 14400 
tctcctcctt aggacccagg agtccaagtc 14460 
ttctcctcct gaggacgcag gaggccccca 1452 0 
acgtcaacac cagcgtgtct ccctccctca 14580 
tgggggagtc tgttaggcaa aagtaagagg 1464 0 
caagggggac cctcgcgggt gcgggtggct 14700 
cggtcactta cactgcacat ccagcacgta 14760 
cgcctggttc tgcgcctcac agatgatgat 14820 
ccgtactgtg cttgccacgc tccagacctt 14880 
cacaccccgg tcagacactg tcaggccaca 14940 
ccaacgccaa agcaggctat ttgccaagct 15000 
tcctccaagc tacgcccctc ccctaaccaa 15060 
tctttcacgc tcatgctttc tcgtctatca 15120 
taaatttata tatatactta gagacagggt 15180 
cctcaagcaa tcctcccatc tcagcctccc 15240 
gcgctcgaca tcaaccacta catattgaat 15300 
ctccacatat aaacaacctc tcctaagtcc 15360 
gcccagggta cctttcagct ccttgcggtc 15420 
ggaccgcgga acgaggcagc tgagctccac 15480 
ctccaccaca ggattctctg gggccactgc 1554 0 
aaggcacgaa cgtgggctca aagcgatcga 15600 
agggtcccag gtggcagggg tcaaagggga 15660 
gttaaaaata gccatggtct gaaagtctca 1572 0 
agaggatgcg tctgacaagg gggagggcgt 15780 
ggtgggtgtc ttctgtgtag agctggcaga 1584 0 
ctgagagccg gatccgcacc cggcgtgggg 15900 
tcaaggctag agagagtgag ggggaaggtg 15960 
ccacccttcc gacaggagct tagagtccag 16020 
tgagtctgag gtgtccaact atttactccc 16080 
gcctgcagga ccagcagtcc gggaccccag 1614 0 
actctcaggt gtgtcctctt tcaggacatg 16200 
aagactcctg agtctggtcc ccagcactca 16260 
cgggctgggt tctggatgac aactatggac 1632 0 
tcagccaccc caccctcagc cactgtcacg 16380 
ggacgattag acaaagagac aggatagaag 16440 
tttctccctc ttccccatcc aaacctccaa 16500 
cactgaacat ttcctgcagg ctagagtcca 16560 
aaagagctgc agtcaagatt tagtagaata 16620 
aggagcccag agcaagggag gactattata 16680 
gggctctgca agaaagctcc attggatctg 1674 0 
cggtggctca tgcctgtaat cccagcactt 16800 
caagagatag agaccatcct ggccaacatg 16860 
aaaaaaaaaa aaattagctg ggtgtggtgg 16920 
gctgaggcag gggaatcgct tgaacccggg 16980 
ccactgcact ccaggctggg cgacagagcg 1704 0 
aaaaaagagt aagcaggagt tcacaaggtg 17100 
atctttcaca cctgggcaca tgttgtagcc 17160 
gtccctggac atgccctttg caagttgatt 1722 0 
gtcccctact agtctgggta agccttgaga 17280 
tgatattgag cctaggcctg aagaggcctt 17340 
catgaagata cccagactag tgtctttgca 17400 
gccggcagcc agcaccaatc gccagctgtg 17460 
cagctgcccc accagctgac agcagccaca 17520 
tctgcccatc tgatacagcc caaactgctg 17580 
ggttgtttta agctcctaag ttgtgggtga 17640 
atacataatt aggctatact tcccagcatc 17700 
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ctttatagtt aggtggggcc atgtgaccaa 

aacacctctt gcagcctgac ccatctccct 

gactccaagg agcctagagg agggcagaat 

tgactgtccc ccatgacccg cctgtatagg 

5 tgttaagcca ttgagatttc aggggtgtct 

catcagaaaa acaaggtggg gaatctagaa 

aagccaagac taatcatcag cattaatatc 

ccccatagct accaattatt aggtacttgc 

catataactt acctttaatc ctcacaatcc 

10 attattatta ttttgggaca gagtattgct 

atctcagctc attgaaacct ccacctccca 

caagtagctg gaattacagg catgcaccac 

gacagagttt agccatattg gcctggctgg 

tgcctcagcc tcccaaagtc cagggattac 

15 tattattatt tttaatttga gacaaggtca 

actgcaatgt ctgcctccca ggctcgagtg 

ctacaggtgc acaacatcac acctggctaa 

ccgtgttgcc caggctggtc ttgaacttgc 

ccaaagtgct gggattacag gcatgagcca 

20 attttgcccg gcctgcgcta ctattatccc 

tttttttttt tttttttttt tgagacattg 

tggtacgatc tcggctcact gcaacctcca 

agcctcccaa gtagctggga ttataggcac 

tttagtaaag acggggtctc accatcttgg 

25 atccacccgc ctcggcctcc caaagtgctg 

tcccattccc attttatagg tgagaaaatt 

ttcacagcca agagtggcag tgccaaaatc 

atctgtatat ccactcctgg ctgtctggat 

gagccgcttg tgatgggcct cgaatgccaa 

30 agtgaaggtt ttgaagcagg aatatgccat 

tggataacta tccatgtctt ttacattcag 

cctgagcatc acgtaggttt tcaggggctg 

tgccctttaa gatttatggg aaggtaggaa 

ctgggcacgg tggctcacac ctgtaatccc 

35 acaaggtcag gagttcgaga ccagcctgac 

atacaaaaat tagccaggtg tggtggtggg 

aggcataaga atcgcttgaa cctgggaggc 

tgcagtccag cctgggtgac agagcaagac 

ataaataaaa gaaagtgtta tgttttctgt 

40 aggggtagaa aagattattt ctgggggatg 

catccatttt tccctttctc ctcagtaaaa 

cactatgtcc agcagaaaaa ggcattcctc 

ataaaatttt gtccagttgg atataagcca 

cctgaaacag gtggacaaac cctttttcta 

45 cagtgtgacg cgtggaattt aggcagccat 

tggcggaacc aagagctgga aggtgcctga 

cagccctcaa ctcctagttc tggacttctt 

ttattttttt aatttatttt agagatgagg 

ctcttatgct caagcagtcc tcctgcctca 

50 tgggtatttc agccactgtt tgaggttttt 

tgtccaatcc ttgccccaga tattttcctc 

ccaccatcca cctggttgct caggtcaaaa 

ccctcatccc caatatccat tccatcagca 

cccagatctc atcacctttg tctgcctctc 

55 cacctggact ctgcaaaagc ctactcgtgg 

gggccattct ccacccagtg gccggatcga 

cctttctgct taaaaccctc cgagggctgc 

ttcccgggga cttcaaggtg ctatatggcc 



ttctggccaa tgggatgtag gtggaagaga 17760 
cataatcctt cacactggct gaacagagag 17820 
cacaagccag aaggaacctg ggtctctaac 17880 
actgtgatat gagcaagaaa tatacctttt 1794 0 
gttacagcct ttaacctacc ctgattaatc 18000 
ccatcagaga aaagcattta ggaaagctga 18060 
atcatctgtt gtcttcaaaa taacaataac 1812 0 
agtgttagtc cctgtgctaa gggcattacc 18180 
ctgtgtaagg tagacatgat tattatcatt 1824 0 
ctgttgccca ggctggagtg cagtggtgtg 18300 
agttcaagcg attcttcagc ctcagcctcc 18360 
catgccgggc taatttttat ttttagtaga 18420 
tctcgaactc ctggcctcaa gtgatccgcc 18480 
aggtgcgacc caccgcgcct ggccaattat 18540 
ggctggagtg cagtggcacg atctcagctc 18600 
atcccacctc agcctcccca gtagctggaa 18660 
cttttgtatt tttttagaga cggagtttca 1872 0 
gagctcaagt gaactgcctg cttcggcctc 18780 
ctgtgcccgg cctgcgctat tattatcccc 18840 
cattttcccc catttccatt tttcttttct 18900 
tcttgctctg tcgcccaggc tagagtgcag 18960 
cttcccgggt tcaagcaatt ctcctgcctc 19020 
ctgccactgc acttggctaa tctttgtgtt 19080 
ccaggctggt ctggaactcc tgacctcgtg 1914 0 
ggattacagg cttgagctat cgtgtcctgc 19200 
ggcccacaga gatgaaatga cttgcccaag 19260 
ttcgtccaaa tctctgattc tgtatcctga 19320 
taagtgtcca tcattggcag ggggttgtga 19380 
cctaggagat ttgctttcat cctaagggcc 19440 
gattagatct ggctatttgt ctttaagtgc 19500 
gtgctgggtt gcattcattc aggagtattt 19560 
agtagtcaga gatgagttag atgaggtccc 19620 
ccaatcacgg taatcaaaag tgttatgtgg 19680 
agcactttgg gaggccgagg tgggcggatc 1974 0 
caacatggtg aaaccccgtc tgtactaaaa 19800 
tgcttgtaat tccagctact caggaggctg 19860 
agaggttgca gtgagccaag atcgcgccac 19920 
tccgtttcaa aaaagaaaaa aaaaaaagaa 19980 
aagagggtag gtaacctaat ttggaagttg 2004 0 
gagacagaga cttctggctt cctattctga 20100 
gaaaagaaca ctggttgtat tttatggttg 20160 
agtctccttg cagcaaggta aagccatctg 20220 
aaatgttgcg tgacaatttt gggaggactt 20280 
ctgagtcacc tttgtgccac ctggaactaa 20340 
attgaaccat gaggacaaga gcagtgggga 20400 
gtctctggtg aagatgtgga gctgctgtaa 20460 
ttatgtttta gtgtaacgct ttgggtattt 2052 0 
tctcactatg ttgcctaggc tggactcaaa 20580 
gcttcatgag tagctgaaac tatagcactt 2064 0 
ctagcacctc ctggaatatc aagcttaaca 20700 
cccaaatttt ctcaatctca ataaatgtca 20760 
acctagaaat cattcaagtt ctctcccttt 20820 
acatctgtcc attctacctc caagacatat 20880 
ctaccctcac tctcatccag catcatccct 20940 
gtctgtctgc atccctgtct gcctcctcca 21000 
tttttcaaag aggtaaatca gatcaattca 21060 
ccgtaacatg tagaataaaa tagagacccc 2112 0 
tggccccttg ctgaccttac ttcactctgg 21180 
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gctcgctagc cttgctgtcc ctcaaacatg 
ccttttcttc cttctgcctg gaatgttctt 
ggctgactcc tgttcccatt tgggtctcaa 
ccctcactgc tcatcccttc acctttagaa 
5 gcccagtgcg gtggctcacg cctgtaatac 
tcacctcagg tcaggagttc aagaccagcc 
aaaaaaatac aaaaattagc taggcagtgg 
aattgcttga acccaggagg cagaggttgc 
acctgggtga cagagagaga ctctgtctca 
10 ttgctctgtc acccaggctg gagtgcagtg 
tcctgggctc aagccatcct cccacctcag 
cccaccacac ctggctaatt tttgtgcttt 
aggctggtct ccaactcctg gggtcaaagg 
ggattacagg cgtgagccac tgcgcctggc 
15 tttatttctt ctatgaagat ttcactggaa 
gtctgtttgt cacccatgac tggaatgtat 
ggtttactgc tgcaccccta gtacccagaa 
aacttgctac atgaattaca tgtgtcagat 
tttctttctc tctttctctc tctctttctt 

20 taaggtctcg ctctgtcacc caggctagag 
cttgaacatg tgggctcaag cgatcctccc 
gaggtgcgta gctatgccca gctaattaaa 
tgggggtctc aatatcttgc ccaggttggt 
gccttggcct cccaaagtgc tgggattata 

25 aatctcattt cagcccgaca actttgtgac 
gatcccagct caaccacttg ccatctgtgt 
agcctcagtt gccccatcta taaaatggga 
gccccgctcc tgaagctcag ggagccctct 
aacatgccca tgcatgtgaa aactggcatg 

30 agcctatcca cagatcctgg acctcaagac 
tgtggagaat gaggcttagc gggtcccagg 
ggagccatca ggttcctctg gatctgcccc 
gggtgcacat ggggtgaggg tgggggtctt 
cagtaaccaa cagtgtctgt gcctggaata 

35 ttgggggtgg tgggggcggg actttctggt 
cactggccct ttaaactgtg ttgacagcca 
ggggacaggg agggtttggg aaagagtggc 
cagcccccaa ctacctcctc tcccaggacc 
tcaggttcca ggagtctgga accccggctt 

40 ccaaccacct cctctctcag gttcccgaaa 
acccaggagt ctgggctgtc agcagcccct 
ccctctccta gcttagacac aggagtctgg 
ggagccaggg gtccagagta cacagctggt 
ggggagcgct tcctgggtcc tgagtcagcg 

45 ccgggaaggt caccaccacc ccctctgtat 
ctccttcccc cttcctccct tagggaggtg 
tcagcccccc atcaatggcg gagtccgaac 
gctcagcctt gtgaaggcgc ctgtattcgc 
ctccctcaga aacctgcagt ggaatccccc 

50 ggagtctgta tcctcatccc ttcctccctc 
ttttccttcc ggacacagga gttccagccc 
ctaagacccc agcctcctcc tccctcaaac 
cctcagactc aggagtctaa gatcccaggc 
ccccaggccc ctcctccctc agactcagga 

55 acccaggagt ctaagacccc agcccctcct 
ccctcctccc tcagactcag gagtctaaga 
cctaagacct cagccccctc ctccttgaga 
cctttagacc cattagtcca ggcccccaga 



ctgagctcgc tcccaccaca gggccttttc 21240 
ctccccacct cccaagcccc atcttcccag 21300 
atcatatcag taccttctca gagaggcctt 21360 
cactttcttt tcttttaaga gacaaagtca 21420 
cagcactttt gagaggccaa ggcgggcaga 21480 
tggccaacgt ggcgaaaccc cgtctctact 21540 
tagcccgggc tactcaggag gctgaggcag 21600 
agtgagccga gattgagcca ctgcacccca 21660 
aaaaaaaaaa aaaaaaaaag agacagggta 2172 0 
gtgcaatcat ggctcactgc agcctcgaac 21780 
cctcctaagt agctgagatt ataggctcct 21840 
ttgtggagac acagattctc catgttgccc 21900 
atcctcctgc ctcggcttcc caaagtgctg 21960 
ccagaacact tgctatttcc tcaccattgc 22020 
ttatcagatt aatttgctta tttgtttact 22080 
actctaggaa ggcagggata taatccaatg 22140 
gagtgcttgg cacctgataa gtgtctgggg 22200 
gggatatctg ttcgtctttc ttctctcttt 22260 
tctctttctt tcttttttct ttttttgaga 22320 
tgcagtggtg caatcatggc tcactgcaac 223 80 
acctcaggct accaaatagc taagactaca 22440 
aaaaaaaaaa tttttttttt tttttagaga 22500 
cttgaactcc taggctcaag caatccccct 22560 
ggcatgagcc attgcagctg gcccagacag 22620 
atcattattt tcatcttaaa cacctaggtt 22680 
gacctgtggg caagtgacct tacctttcgg 2274 0 
atgatgccag tgcctgcctc ataaggatga 22800 
ctgcaaggct gttttagtgc aacctccgga 22860 
cacattctgg tgcttttaaa aacatctcga 2292 0 
tggttcagtg ctagcccccc attttacaga 22980 
caagtcagtg gcaaaactca ccatctcctg 2304 0 
caccaaattt atcccctgct ctctgcttga 23100 
ttgttttact ccctccccct cctgaggagt 23160 
ttaatgtctc agcagctttt gtttgggggg 23220 
cagagagggg ctgagctttg gggactgagg 23280 
ggagtcgtca tggggatggt gcttggaaaa 23340 
ggagcaggta atgcgtaaga cccaggaatc 23400 
caggagtcta ggctcccagc ccctcctcca 23460 
ctttccgcct tagacccagg aattcagccc 23520 
tccagacccc tagccccctt ctcgatcagg 23580 
tccttcaaac ctaggagtca gagcccccag 2364 0 
gcctccagcc ccctcctcct tcaggaccca 23700 
ggatgtttcc acggagacta agcagggtgg 23760 
aatacccaag ggagtctcaa ggtcatagtt 23820 
ccgctcccca gggggctcct ggcatcctgc 23 880 
gtacatccct gcgtcctgac tgaacccccc 23 940 
atcctcgcac aaagcgtcaa ttcttcccca 24000 
aggacctagg cgtcagggtc tcagcccctc 24060 
gcctccagcc ccttcctccc tcaggaccca 24120 
aagacctagg agtgtggact cccagccccc 24180 
tcggccctct cctctcttaa acccaggggt 24240 
tcaggagtct aagatcccag gcccctcctc 24300 
ccctcctccc tcagactcag gagtctaaga 24360 
gtctaagatc ccaggcccct cctccctcag 24420 
ccctcagact caggagtcta agaccccagc 24480 
ccccagcccc ctcctccctg gacccaggag 2454 0 
cccaggagtc taagacccta gctccctcct 24600 
ccctcctcca tcagacccag gagtccaggc 24660 
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ccccagcccc tcctccatca gatccagccc 
ccccagtccc caacccctag aagcacagtc 
atctggggac ctaggcatca ggtgggggcg 
gtccccgctg tggcccccac attcctggga 
5 ggcccagcca gggagtgggg agtcccccag 
aattcctgct ccgggaaggg tgcaggcctg 
cccagtgccc tctattcacc ccctcttccc 
gccccactgg gtgcccacgg aggagcctgc 
acaggcggaa atcagtgggt gcttccgttc 

10 tctgactgtc tccaggccac cccccacccc 
tccaagatgg ggacaggcca ggctcgcacg 
ctgtgtctaa ggtcttggaa tccactgcag 
cacaggcgcc tggctcatgg gtgggtgggt 
ctgttccttg gggtgactca caatggaggg 

15 cagaatttta gcaggaaaaa gtgagtcacc 
aactgccccc tccacaagac ccctcaactc 
ggatatctgt ttcctctcct cctttctgtt 
ctgcctgggt gcatccctgg gcaggcaacc 
ccaccctgga tccttctttg ggcataaatc 

20 atgaaccagg agagagagaa catgttttta 
attcctgctg gctgggcaag gtgagagagg 
aacagatacc ccctaaaatg tggtagccaa 
agcaggaagg gccctccaag accacatgct 
ggaaagtaag gcccagagag ggacaaggac 

25 taaggcttgg acccaagttc cttagctccc 
cagtttctac tggtaaaagc cacatactat 
agggtgccag gaagcagtga cttggaaatc 
ccagaagcac cagagaaagg cttttgcacg 
atcctgagaa ttcaaagtct gatgattcta 

30 caagatccag gaactccaag acatcaagat 
catgctaaca ccatcacggt tctagaactt 
attctagaat cctgtagatg tcagcattct 
ttcattagtt ccaggattct atgagcctgg 
aattgatgga aatgtcactg aggtaccaaa 

35 ttgtaaagaa aggaggtaat gatgcaagtt 
agaaagacag tgagaggaca gctttgcccc 
ctcaaaccct ggagtgggga acatgtaacc 
tctgagctgg cgttcccttt catgtcactg 
aacagaagcc tggagagagg aaggtgttta 

40 caagatttaa gcccaggccg ccagccccat 
tctgccgaac acccagccct cctgcttctg 
caaaagtggc cttatccacc agggaggggt 
gtgagagtgt gtgtgggtga catttcctga 
tcgggggtct ccagcttctc acagtgtgtg 

45 cctggacagg ggcttctctg tgagtcaagc 
gagaggcatt cgctgaatcc acgtgtgtgc 
cccacacaca tgcacacaga tgttcccctc 
aattcctctt caggggcaca gagggataga 
gatcccggga tggaggctgt aagcgtagag 

50 agatagtggg acagagaagg gggaaagaga 
gacagaaaga caggggacag agacaagggg 
acagaaaaac aagggtgaca gcgagacaga 
agggcagaaa tccgggggaa agagaataga 
gaaaagggga cagagaccag gggacagagg 

55 accgaggcaa gaagagaggg agacagacag 
tagaggacaa gggtaggggg acgaggagcc 
agggacgcag agactggaca gaaggacagc 
gtgtaggggg gtctcgggcc ctttgtcccc 



ctcctctcct gaaaacttct gactctaact 24720 
ctgcctttcc tcaatcctct gtcccctccc 24780 
taggggtgag tcagcaacct cacacacaaa 2484 0 
tattcgggac tccctggatt ccaggcctca 24900 
aggtcctccc tgggtgtggg gtacgagagg 24960 
cactgagctc cctctgtccg aacctccacg 25020 
agaagagccc aggctcagca cctgcccctt 25080 
gtgcctgctc cctatgggcc tggggtctgc 2514 0 
tgatgccaca ggccattgga tgctggcggg 25200 
tcccagagag agaaagctgc ctttgtgttc 25260 
acattaaccc agccttaggc cccagccctg 25320 
aacctgaccc ccacccccag gctctgggga 25380 
gggggggtca gtgatagaaa cctccaaaac 25440 
agggtccccc tattctcaag agtggctggt 25500 
ctgggaagga aacattattt agggaccaac 25560 
ctaatagcct ctctattctt tctttgtatt 25620 
ctacccagtt tctggctgcg ggtcccattt 25680 
catccctccc tcttgctttc tctcctctgc 25740 
tcatcttctt ctgctatgct cagaagatga 25800 
aaatggcgca aatgcacccc atctcccccg 25860 
aagaagtgac taagagagaa atgtgggaac 25920 
ggccactgag aaatatccaa tggaaaggag 25980 
acagcctcct accccatgct ttacagaacg 26040 
tgatgcaaaa ttatactaaa gggtcctggg 26100 
agctgagagc tcttcccatg acaccaagct 26160 
ttactttaga gaaagtttac agagagggtt 26220 
aaacgaggga cagggctgta gacctaactc 26280 
gggcgggtgg tcaccttaag ctatattctg 26340 
agctgtcagg attctaaatg tcatagatgt 26400 
ttcacgattt ttaagacgtc aagatgctag 26460 
taaaggtgtc aagattctaa agccttctgg 26520 
aaagtaccat caggttcttt atttactgga 26580 
tgtttagcct aaaaaataaa gataaattaa 26640 
gttctcatct gggaaattgt ggcatgtctg 26700 
ctaaagcagt cacagaagac tagagaagaa 26760 
tcatcctggc cgaggtgagg atggctctgc 26820 
gcactcaact tgccagaaac cccttcacgg 26880 
agttcaacat cctcacttta cagaaagaga 26940 
ccattggctg cgatggcaaa tggcaagagc 27000 
gccacctggt tataactcct ctcaccaatc 27060 
cctagccacc ttccaatcct ctgttccttc 27120 
gacccgtggc aggttcaaga cttacacagt 27180 
ccttgtcccc attctcaggg tcacccaacc 27240 
atgagggtat gtggatggct ccctggatgt 27300 
ctgggtgtgt gaatgggtga gcagggtttg 27360 
ctacacgcca aggtccccca ttctcacttc 27420 
cagggctctt tagaatgccc tgcctgactg 27480 
gagagggagg aaggtaggat gggaatggga 27540 
agaggaggca cagcagaaag acagggatgg 27600 
caggtgacag aaagggttag agaaacgagt 27660 
atggggcaga taggggacag agaaaaaggg 27720 
gacagggacc aagaataggg gcagagaggg 27780 
caggatgatg gaggggacag agtgacccag 27840 
taggggacaa agacagaata gatgaggaac 27900 
aaggagggac aggacttcga gactgaggga 27960 
agacgggggg gttcagagac gggcggacag 28020 
gggaccggcc tggggagggc ggacttgtgt 28080 
gccgggatcc agcctgcgcg ggtggggggg 28140 



WO 01/05422 



62 



PCT/FROO/02057 



ctgcggcacg gcggccgggc cccgcgcccc 
ccgcgctgcg ctttgtcccg gggagggggc 
tctgcggccc cgaggctgcc gggctgtcac 
gccgaccccg gcccccgacc ctacctggcc 
5 gccactggaa gcgccgggcc cggcccatgg 
ccggcccggc acctgcaccg cccgcgccgc 
ccgcccgggg gcggggcgcc gaggccgggg 
gagaggcccg gagacaatcg gggggacggc 
ctggagagga gaggggtgag gagggcggga 
10 ggagcaggtg ggggatctcg gtgagcgcgg 
gtgcgggccc aggtgctgcg cgcgagggtg 
tgcgcggagg ggagggtggc agggtgttgc 
gtcgtggggt gcggtgtgtg cgaagggaga 
gagggagtgc gacgtgggaa aggtgagtgt 
15 ggagtctagc gagaggctgt gagctgagcc 
ccggagggtc cggaggtcga ggcaggtcaa 
tcaggagtgg ggtggggtca gttccctccc 
cgtgtttccg cgtcattctc cgggaggggc 
ctgaatcctg ggtcccagga gggagaggct 

20 cctctcctcc ctgctgtctc cctgccccag 
tctgcccttc ctctctcccc atctttgagg 
ctccctcctg ggagtgggtt tccctgagcc 
gggatcatta cctatgggac ccagaaagag 
ctctcatgcc catttgtcag gcaaactgag 

25 cttcccccct cccccctccc cgcccagacg 
cagtggcacg atctcgactc actgcaacct 
ctcagcctcc cgagtagctg agattacagg 
atttttagta gagacggagt tttgccatgc 
aggtgatcca tctgtctggc ctcccaaagt 

30 ggctgaaaat ccttactttt tattccgact 
cttcagcttc acacaccctt tctgtcctca 
caaaaccata gctaccatca acccttgtgt 
gtcctcaggg tccaagctcc catcaactcc 
ctctctgtcc ttcaggtcca agctcccatc 

35 gcatcctctc tgtcctcagg gtccaagctc 
ctccagcaat cctctctgtc ctgagagccc 
ccatagccct gagcaacttc cttctttttc 
gggaagagat agtctctaat cctctttcca 
ggagaggaat gtttgatctg cctttggaat 

40 tttcccgcag gagccaatag gcccgctcac 
gctgaagggg aaccttggga gatgttggtt 
cattccatgt gaagacatca caagagtagt 
taatcccagc actttgggag gccaaggtgg 
cagcctgacc aaccggccaa catggtgaaa 

45 ttagcaaggc gtggtggcac gtgcctgtaa 
aatcccctga acttgggagg cagaggttgc 
gcctgggtga cagaatgaga ctcagtctaa 
ataataataa taaatagaat agtggtcctg 
ttagggattt agtgcaagtg acagcaagtg 

50 ggttcacaca taacaaaaag tccttctatg 
tcctaaggat gcatggctcc cctcctgtag 
gattcatatt tggggtgatt aagattctgc 
ttttcaattg ttgcctgtcc ctggtgagac 
actttcaata acaccgtttt tgcttaagtc 

55 aagattcctg aacaacaact tcagagccgt 
tataggacgt gagaaatttg tccctagcct 
gtatttctat cctctgatcc ccactgtagg 
atctctgcca tagagtttca taggcaatgc 



ctcccccgct cgtcgctccc ggctcccggc 28200 
ccggcccggc cccgcgcgca ttgttcggcc 28260 
cacagcgcgc cccccgcccc agcccggccg 28320 
ccgccgcggc cgcccacagc agcagcagcg 28380 
tgccgccgcc gccgccgccg ccgctcgctc 28440 
ccgccccgcc ccccgcgccc cgccccctgc 28500 
cggggccggg gaggggaggg ggagacggag 28560 
acggtggggg aacggtgcgg ggtgcgaaag 28620 
aggggtgcgc gggagggcga cagcggcgtg 28680 
gaaatggagg gtgttgggtg agggtgctgc 28740 
cggagttgct ggcatgcagg gtgcttgcgc 28800 
tggaggctgt gcgagggtgg gggcgcgggc 28860 
gcgtggccag cgtgacgggg gagcgtaagg 28920 
gagaggcgtg ctgcgggcag gtgggtgtct 28980 
accgggacag gggaggctgc agctggaggt 29040 
ggatctccca gggcagggcg aggctggggc 29100 
tccctctctc ctgtcctgac ctgaaaaccc 29160 
cccctgaaag cgaactaact ggaaggaagc 29220 
cctgtgaaca ccttccaagc cctggcgtcc 29280 
cctctctccc tctctctgca tgtatttgcc 29340 
gtgactcacc cctccagacc taggtccctt 29400 
cacttctgtg acaccctgta gacctgatgc 29460 
tgagaaacca tggaaagaag gcctcgacct 29520 
gtccagaagt gccaattatg aacatctttc 29580 
gagtctcgct ctgttgccca ggctggagtg 29640 
ctgcctccca ggttccagtg attctcctgc 29700 
cgcccgccac catgcctagc taatttttat 29760 
tggccaggct ggtcttgaac tccttacctc 29820 
gctggattac aggcgtgagc caccatgcct 29880 
aaaaaatttt acatccagtc ccacaaggga 29940 
gtacccagct cccagtatcc tttctgacct 30000 
cccaggacca tggctcccag tgtcttctct 30060 
tgtgtcctca ggaccacggc tcccagcatc 30120 
aacccctgtg aagcaggacc atggctccca 30180 
ctatcaactc ctgtgtcccc aggacgatgg 30240 
aagcttctaa ctgcccctgt gtccccagat 30300 
agtcctcagc ttcccagctt ctgtagactt 30360 
gggctcacat tctgtgactt ttgctagatg 30420 
actggtccaa ggggtaacta gtagttgcct 30480 
tctgtgctct gacagatgtc tcctgctcca 30540 
tggttctcac ctgtcatcct taagtcccac 30600 
ggtcctgacg ggcgcgttgg ctcacacctg 30660 
gccgatcact tgaggtcagg agtttgagac 30720 
caccatcttt accaaaaaaa aaaaaaaaaa 30780 
tcccagctgg tcggaaggct gaggcatgag 30840 
agtgagctaa gatcatgcca ctgcactcca 30900 
ataataataa taataataat aataataata 30960 
tccccatcct acttcagggt accctgtcca 31020 
caacccaact ggtttgagag aaagagaact 31080 
gctggctttg gcgaggtctg tcaatctctg 31140 
caagatggct ggcagatacc cctggggcca 312 00 
aagagagaga caacctttat ttcacacagc 31260 
tcggagacct agctcttgcc tggtttctaa 31320 
agcacaaaca gattttattt cttgcaagca 31380 
taacaatgag gtcctgatca caagctatgg 31440 
caatatctgc tggagggcat catggaataa 31500 
gcatcatggg atatataatc ctaaccttca 31560 
agtcctagcc tcaatatgtt gtagggaatt 31620 
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atgggaaagg tgaaattatc ctcaattata 
gcctcatctc tgctgtaggg catcatggga 
gttgccatag aagatgcagt ctttccttcc 
tttttttttt ttttattatg tagagacagg 
5 gaactcctgg gctcaagcag ttctcctgcc 
aagagccatt gcacccagtc ccttctctcc 
gcactaggaa taaatcatca agtaaataaa 
ggaaagttag ctaaaaacaa acaaaaatta 
aataccccag aacgtagtgg tgtgaaacaa 
10 aggaattgga gcaggattgg tgtgtatctg 
tagctggaac agctggagat ggaggggagg 
ggttggtgtt gtgggttttg aatagtgtcc 
ccctggtatc tgtacatgtg accttatttg 
tttttgtttg tttgtttgtt tgctcgagac 
15 gcagtggcat gatctcggct cactgtaacc 
cctcagcctc ccaagtagct gggattatag 
tattttcagt agggacgggg tttcaccatg 
caaatgatct gccacctcag cctcccaaag 
cctgcccaga tgtgattaac ttctaacccc 
20 ataaggtggg tttttttctt gttttttttt 
caggctggag ttcagttgca taatctcagc 
cgatcctccc gcctcagtct cccgagtcac 
gctaattgtt gcagtttttg tagagatggg 
ttgccaccct caagcaattc atccgcctcg 
25 agccatggcg cccggccaga aagtctttgc 
ccatgctgag ttagagtggg ctctaaatcc 
atttggagac atagccacag tcccagggaa 
agagtgatgc agctacaagc caaggaatgg 
aggagaggca aggaagggtt cttcccctga 
30 tcactgctgt cagcctcagc tggagtgcaa 
cctcccaggt tccagcaatt ctcctgcctc 
ccgccaccat gcctggctag tttttgcatt 
ccaggctggt ctcgaactcc tgacctcagg 
tgggattaca ggtgtcagcc ccggagactt 
35 aaagcgtggc tcttcccgtg agacttcaac 
ctgtgagaga acaagtttct agtgtgtgtg 
tgtgtgtgta tgtgttttag acagaggctc 
tcaatctcgg ctcactgcaa actccgcttc 
tcccaagtag ctggaattac agaggagcgc 
40 tttgtacttt tagtagagac agggtttcac 
gcctcaagtg atatgcctgc cttggcctcc 
cacacctggc ctaagtttct gtgtgtgtgt 
tttgagtgga gtctcgctct gttgcccagg 
tgcaagctcc gcctcccggg ttcacgccat 
45 actacaggca cccaccacca cgcccagtta 
tcatcatgtt agccaggatg gtctcgatct 
cccgaattgc tgggattaca ggcatgagcc 
agccaccttg cttgtaagat ttgtgtgtgt 
tgaatacata atagtggtgt atatttacag 
50 gttttttttt tggagacaga gtctggctct 
catggctcac tgcagccttg acctcccggg 
tgtaactagg accacaggca tgccccacca 
gagatgaggt ctcactgtgt tgcccaggct 
cctttctcac cctcccaaag tgctaggact 
55 atgatgtttt gatataggca cacaatgtgt 
aggcagccct aggaaactaa tatagccaag 
tggggctaca tgtccaaggt ggcttcttca 
ctgaaacatc tggggctcta tctccacatg 



atacagagca tctcagaaaa tgtcgtttta 31680 
gatatacttc tggcccaatt tttgttgtaa 31740 
ttcccttttt tcttttcttt ctttctttct 31800 
gtctctcgct atgttgccca ggctggtcct 31860 
ttggcctccc aaagtgctgg gattacaggc 3192 0 
tttctttctt catcacctgc catattccag 31980 
cggccttacc ctccctggca attataatgg 32040 
ctgttccatt taaccatcgc tgaataacaa 32100 
caacctttta attttatgat tctgtgagtc 32160 
cttcatgatg aactggagcc aaaaatgaac 32220 
ggcatcaagg gccatatatc taaggctggt 32280 
tccaagtaaa atatatgttg aagttctagc 32340 
gaaataaaat ctttgcaaat gtaattcact 32400 
tgagtctcgc tctgtcaccc aggctggagt 32460 
ttcacctcct gggttcaagc gattctcctg 32520 
gcacgtgtca ccatgcccag ctaatttttg 32580 
ttggccaggc tggtctcgaa ctcctgacct 32640 
tgctgggatt ataggcatgg ggcactgcat 32700 
tggtatcttt gcatgtgact ttatttggaa 32760 
ttttttttga gacagtttca ctttgtcgct 32820 
tcactgaaac ctctgcctcc gaggctcaag 32880 
tgggactacg ggcaagcgcc accacacccg 32 940 
gttttgccat gttgcccagg cggtctccaa 33000 
gcctcccaga gtgctggaat tataggtgtg 33060 
agatttagtt gaattaatga ctaaatgttt 33120 
aatgattgat atggggttat aaggagagat 3 3180 
ggtggacatt ggaagacaga ggtagggatt 3 324 0 
caaagattgc tggcagtccc tcagaagcaa 33300 
gacttttttt tttttttttg agacggagtc 33360 
tggcgcgatc tcggctcact gcaacctctg 33420 
agcctcccga gtaactgaga ttacaggcac 3 3480 
tttagtagag atgggatttc accctgttgg 33540 
tgatccaccc gcctcggcct cccaaagtgc 33600 
taaaagcatg gctcttcccc tgacgcttta 33660 
accttggttt tggacattta gcattcagaa 3372 0 
tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 33780 
attctgttgc ccaggctgga gtgcagtggt 33840 
tcagattcaa gtgattctta tgcctcagcc 33 900 
catcacagcc ggctattttt tttttttttt 33960 
tgtgttggcc aggctggtct caaattcctg 34020 
caaagtgctg ggattacagg tgtaagccac 34080 
gtgtgtgttt tgttttgttt tttttttttt 34140 
ctggagtgca gtggcatgat ctcgactcac 34200 
tctcctgcct cagcctcccg agtagctggg 34260 
attttttgta tttttaatag tgacagggtt 3432 0 
cctgacctcg tgatccgccc gcctcagcct 34380 
accaaacccg gccaagtttc tgtggtttta 3444 0 
gtgtttttaa ttttttattt ttaagtatta 34500 
gacatatgta atatggtttt gggttttagt 34560 
gttgcccagg ctggagtaca gtggtgggat 34620 
ctcaagggat cctcctgcct cagcctccca 34680 
catccagcca attttttttt atttttagtg 34740 
gatcttgaac tcctgagctc aagagatctt 34800 
acaggcatga gccactgtgc ctgtccttcc 34860 
tagtttataa agtttgtaat aatttatcac 34920 
tttcctgttt cttctctata tcacatctgc 34980 
cccacttgtc tggtgcctgg gctgagatgg 3504 0 
gcatttatac atgagtagct tgggcttcct 35100 
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cacagcatgg tggtctcagg gcagtagtac 

agcgttctaa gattcagaaa gtgaaaaatg 

agcacagcaa aacttccacc acattctact 

caagaggcag aagtacagac ctcacttctt 

5 tcattagaga aagccctaaa caagaacctt 

gatgtctttt tttttttttt tttttttttg 
tgatc 



ttttacatgg caaccagctt ccccagagtg 35160 
aaagtttctt aaaacttggt tccagaacat 35220 
ggtcaaagca gtcacagagt cactcatatt 352 80 
taagccacta cagtgacagg tggtgatatg 3534 0 
gtccctcacc tgcccccaaa taccatggaa 35400 
gggatagtct cactgtgtca tgcagtggtg 35460 

35465 



10 <210> 57 

<211> 14327 

<212> ADN 

<213> Homo sapiens 

15 <400> 57 

ggccggcgag cgggcggctg cgggcggcgc 
agagcggcgc gggccgggcc atggggtggc 
tgctgcacgg gcggctgctg gcggtgaccc 
tgcctgagga catagagacc gtcacagcaa 
20 ctgatgatga gtacatgctg gctgacagca 
tgggcagcgg ggacttccag atggtttatt 
tcgagtacag ccctcagctg gaggatgcag 
ctgtggtaga cacgctggag tcggagtact 
tggtgttcat caaggagctg gatggctggg 

25 ggaatgcgga tggtgctcag attcaggaga 
tggcctccta cgtcacctct ccccagggat 
agttcccaag agcctgcacg gaggccgagt 
ccctggagta tcgctgtgac cggcggcccg 
gtgaggagcc agtcctgggt atcagcccca 

30 taccgccccg gccagagaca accatcatgc 
ccctgcttcc cggttccgtc aggcccctgc 
atgggcactg catccccaga gactacctct 
gcgatgagct agactgtggc cccccgccac 
atggacattg tgccctcaag ctgtggcgct 

35 ctgatgaagc caactgcccc accaagcgtc 
gatgcgtctc taccaacatg tgcatcccag 
gtcctgaccg gagcgacgag tttggctgca 
agtccatcca ggcttcccgg ggccagacag 
ccacccccat catcaattgg aggctcaact 

40 cagtgaccag cgagggtggc cgtggcacac 
agggtgccta cacctgtgag gccatgaacg 
gtgtccttga gctcgtccca caacgaggcc 
acagcgccgc ctgcctgccc tgcttctgct 
gccgcttccg ggaccagatc aggctgcgct 

45 atgtgacaat gcctgcgcag cccggcacgc 
acccatccct gcacgagttc cagctagtag 
ccttctgggc tctgcctgaa cagttcctgg 
tgcgttacaa cgtgcgctac gagttggccc 
acgtggtcct cgtgggtgcc gggtaccgcc 

50 ctggtgctct gaaccagcgc caggtccagt 
gccggccggt gcagcgcgcg gagctgctgc 
tccagaccgt gtacaacacc aagatggcta 
ccaccgtcac ccatgccacc agccatggcc 
ccattggcta ttctggcttg tcctgcgaga 

55 gtgggcccta cctgggcacc tgctctggtt 
accctgtgta tggccactgc ctgaattgcc 
agtgcaaggc tggcttcttt ggggacgcca 
gcccttgccc atacatcgat gcctcccgca 



ggagcgggcg gcgcggagcg agcgagcgag 60 
gggcgccggg cgcgctgctg ctggcgctgc 120 
atgggctgag ggcatacgat ggcttgtctc 180 
gccaaatgcg ctggacacat tcgtaccttt 240 
tctcaggaga cgacctgggc agtggggacc 300 
tccgagccct ggtgaatttc actcgctcca 360 
gctccagaga gtttcgagag gtgtccgagg 420 
tgaaaattcc cggagaccag gttgtcagtg 480 
tttttgtgga gctcgatgtg ggctcggaag 54 0 
tgctgctcag ggtcatctcc agcggctctg 600 
tccagttccg acgcctgggc acagtgcccc 660 
ttgcctgcca cagctacaat gagtgtgtgg 720 
actgcaggga catgtctgat gagctcaatt 780 
cattctctct ccttgtggag acgacatctt 840 
gacagccacc agtcacccac gctcctcagc 900 
cctgtgggcc ccaggaggcc gcatgccgca 960 
gcgacggaca ggaggactgc gaggacggca 1020 
cctgtgagcc caacgagttc ccctgcggga 1080 
gcgatggtga ctttgactgt gaggaccgaa 1140 
ctgaggaagt gtgcgggccc acacagttcc 1200 
ccagcttcca ctgtgacgag gagagcgact 1260 
tgccccccca ggtggtgaca cctccccggg 1320 
tgaccttcac ctgcgtggcc attggcgtcc 1380 
ggggccacat cccctctcat cccagggtga 1440 
tgatcatccg tgatgtgaag gagtcagacc 1500 
cccggggcat ggtgtttggc attcctgacg 1560 
cctgccctga cggccacttc tacctggagc 1620 
ttggcatcac cagcgtgtgc cagagcaccc 1680 
ttgaccaacc cgatgacttc aagggtgtga 174 0 
cacccctctc ctccacgcag ctgcagatcg 1800 
acctgtcccg ccgcttcctc gtccacgact 1860 
gcaacaaggt ggactcctat ggcggctccc 1920 
gtggcatgct ggagccagtg cagcggccgg 1980 
tcctctcccg aggccacaca cccacccaac 2040 
tctctgagga gcactgggtc catgagtctg 2100 
aggtgctgca gagcctggag gccgtgctca 2160 
gcgtgggact tagcgacatc gccatggata 2220 
gtgcccacag tgtggaggag tgcagatgcc 2280 
gctgtgatgc ccacttcact cgggtgcctg 234 0 
gcagttgcaa tggccatgcc agctcctgtg 2400 
agcacaacac ggaggggcca cagtgcaaca 2460 
tgaaggccac ggccacttcc tgccggccct 2520 
gattctcaga cacttgcttc ctggacacgg 2580 
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atggccaagc cacatgtgac gcctgtgccc 
gtgcccccgg atacgagggc aaccccatcc 
aggagattgt gcgctgtgac gagcgtggca 
gtaagaacaa tgtggtgggg cgcttgtgca 
5 gtacccgaaa ccccgatggc tgcctcaagt 
ccagctcttc atggagccgt gcccagttgc 
gcctgaccaa cgccgcaagc acccacacca 
gggaactggg attctcctcc ttccacagac 
cttcacgctt cctgggggac aaggtgacct 
10 cccagaggtc ccagccgggc tccacacccc 
gtaacaacat catcctagag caccatgtgg 
ccttcattgt gcctttccgg gagcaagcat 
gggagcacct gctgatggca ctggcaggca 
cccagcagcc cgctgagagc agggtctctg 

15 aaaccggcca ggaccccgcg ctggaagtgg 
ggccgtcctg ccaggactgt gacacaggct 
gtacctgtga acgctgcagc tgccatggcc 
cctgccaggg ctgccagcat cacacggagg 
actacgggga cgcccagcgg gggacaccac 

20 accctgctgc cggccaggct gcccacactt 
gtgatgcgtg ctccccaggc cacagtgggc 
atggcaaccc cagccagggc cagccatgcc 
gctgcaactg tgacccccaa ggcagcgtca 
agtgcaaggc ccaggtagaa ggcctcactt 

25 tgagtgccag caacccagac ggctgcctgc 
gcgccagctc tgcctacaca cgccacctga 
aaggctttgc cctggtgaac ccacagcgaa 
aacccgtgcc cgagggtgcc cagctctctt 
ccttctactg gcagctgccg gagacatacc 

30 agttgcgata caccctctcc tacacagcag 
atgtgcagat cacgggcaac aacatcatgc 
cagagaggag gagctacgag atcatgttcc 
agccggccac acgcgagcac ctcctgatgg 
gggccacgtt ctcctccgtg ccgctggtgg 

35 cccagccggg gccctcaaac agaccccgcg 
caggctacat cggtctgtcc tgccaggact 
ggctctacct cggccactgc gagctatgtg 
cagagactgg ggcctgctcg caatgccagc 
gtgcccctgg ctactacgga gatgccacag 

40 cctgcccact gaccaaccca gagaacatgt 
gcgggtaccg ctgcacggcc tgcgaacccg 
gcccaggtta cgtgggtaac cccagtgtgc 
aagccccact ggtggtcgag gtccatcctg 
actccctgcg gtgtcaggtc agtgggagcc 

45 atgggcggcc tgtgcccagc ggcacccagc 
ccagcgtcca gccctcggat gctggggtct 
ccaataccag ccgggcagag ctgctggtca 
ctgtggagga gcagcggagc cagagcgtgc 
cagccaaaag caagtcccca gcctataccc 

50 tgcccacccg agccatggat ttcaatggca 
atgcaggcac ctacgtgtgc accggctcca 
ctctacatgt gcaggcctcg ggcaccttgt 
agctcacagt gcagcccggg caactggcgg 
cgcccaccct cgagtggaca gggggccccg 

55 acggcggcat cctgcgcctg ccagctgtcg 
gagcccacag cagcgctggg cagcaggtgg 
gtgggcccag agtccaagtg agcccagaga 
ggctgtactg cagggctgca ggcgtgccta 



caggctacac tggccgccgc tgtgagagct 2640 
agcccggcgg gaagtgcagg cccgtcaacc 2700 
gcatggggac ctccggggag gcctgccgct 2760 
atgaatgtgc tgacggctct ttccacctga 282 0 
gcttctgcat gggtgtcagt cgccactgca 2880 
atggggcctc tgaggagcct ggtcacttca 294 0 
ccaacgaggg catcttctcc cccacgcccg 3000 
tcttatctgg accctacttc tggagcctcc 3060 
cctatggagg agagctgcgc ttcacagtga 3120 
tgcacgggca gccgttggtg gtgctgcaag 3180 
cccaggagcc cagccccggc cagcccagca 3240 
ggcagcggcc cgatgggcag ccagccacac 3300 
tcgacaccct cctgatccga gcatcctacg 3360 
gcatcagcat ggacgtggct gtgcccgagg 3420 
aacagtgctc ctgcccaccc gggtaccgtg 3480 
acacacgcac gcccagtggc ctctacctgg 354 0 
actcagaggc ctgcgagcca gaaacaggtg 3600 
gccctcggtg tgagcagtgc cagccaggat 3660 
aggactgcca gctgtgcccc tgctacggag 3720 
gttttctgga cacagacggc caccccacct 3780 
gtcactgtga gaggtgcgcc cctggctact 384 0 
agagagacag ccaggtgcca gggcccatag 3 900 
gcagccagtg tgatgctgct ggtcagtgcc 3960 
gcagccactg ccggccccac cacttccacc 4020 
cctgcttctg tatgggcatc acccagcagt 4080 
tctccaccca ctttgcccct ggggacttcc 4140 
acagccgcct gacaggagaa ttcactgtgg 4200 
ttggcaactt tgcccaactc ggccatgagt 4260 
agggagacaa ggtggcggcc tacggtggga 4320 
gcccacaggg cagcccactc tcggaccccg 4380 
tagtggcctc ccagccagcg ctgcagggcc 4440 
gagaggaatt ctggcgccgg cccgatgggc 4500 
cactggccga cctggatgag ctcctgatcc 4560 
ccagcatcag cgcagtcagc ctggaggtcg 4620 
ccctcgaggt ggaggagtgc cgctgcccgc 4680 
gtgcccccgg ctacacgcgc accgggagtg 4740 
aatgcaatgg ccactcagac ctgtgccacc 4800 
acaacgccgc aggggagttc tgcgagcttt 4860 
ccgggacgcc tgaggactgc cagccctgtg 4920 
tttcccgcac ctgtgagagc ctgggagccg 4980 
gctacactgg ccagtactgt gagcagtgtg 5040 
aagggggcca gtgcctgcca gagacaaacc 5100 
ctcgaagcat agtgccccaa ggtggctccc 5160 
caccccacta cttctattgg tcccgtgagg 5220 
agcgacatca aggctccgag ctccacttcc 5280 
acatttgcac ctgccgtaat ctccaccaat 534 0 
ctgaggctcc aagcaagccc atcacagtga 5400 
gccccggagc tgacgtcacc ttcatctgca 5460 
tggtgtggac ccgcctgcac aacgggaaac 5520 
tcctgaccat tcgcaacgtc cagctgagtg 5580 
acatgtttgc catggaccag ggcacagcca 5640 
ccgcccccgt ggtctccatc catccgccac 5700 
agttccgctg cagcgccaca gggagcccca 5760 
gcggccagct ccctgcgaag gcacaaatcc 5820 
agcccacgga tcaggcccag tacttgtgcc 5880 
ccagggctgt gctccacgtg catgggggcg 5940 
ggacccaggt ccacgcaggc cggaccgtca 6000 
gcgccaccat cacctggagg aaggaagggg 6060 
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gcagcctccc accacaggcc cggtcagagc 
ccatcacgac tgctgacgcc ggcttctacc 
cccaggcccg gatgcaagtg gttgtccttt 
agattgagtc ctcatcgcct tctgtgacag 
5 tggcagggtc agcccatgcc caggtcacct 
acacccaggt gcacggctcc cgtctgcggc 
aatatgtgtg ccgtgtggag aatggatcgg 
tgctccacgg cacccattct ggccccagct 
tccgcatcga gccctcctcc tcacacgtgg 
10 tggtgcccgg gcaggcccac gcccaggtca 
cccggcacca gacccacggc tcgctgctgc 
gcgagtatgt gtgccatgtg gtgggcacct 
ccatcgaagc ctctgtcatc cctggaccca 
ccacagtggc cgagggccag accctggatc 
15 cccaggtcac atggtacaag cgtgggggca 
cccgcctgta catcttccag gcctcacctg 
gcaacggcat ggaggcctcc atcacggtca 
cctaccctgc cggcagcacc cagcccatcc 
aagggcagac cctggatctg aactgcgtgg 

20 ggcacaagcg tgggggcagc ctccctgtcc 
tctaccaagc gtcccccgcc gactcgggcg 
tgcctctaga ggcctctgtc ctggtcacca 
gggtcacccc cacggtccgg atcgagtcat 
tggacctgaa ctgcctcgtt gctggtcagg 

25 ggggcagcct cccggcccgg caccaggtgc 
ccccagctga ttcaggggag tacgtgtgcc 
cctcagtcct tgtcaccatc cagcagcgcc 
accccgtccg catcgagtcc tcctcagcct 
actgcctggt tgccagccag gctccccaca 

30 tacccagccg gcaccagatc gtgggctccc 
actcgggcga gtacgtgtgt cacgtcagta 
tcgtcaccat ccagggcagc ggttcctccc 
tcgagtcgtc ttcccccacg gtggtggaag 
ccaggcagcc ccaggctatc atcacatggt 

35 accagaccca tggctcccac ctgcggttgc 
atgtgtgccg ggccaacaac aacatcgatg 
cccctagcgc cggcagcccc tccgcccctg 
cctcctcaca cgtggccgaa ggggagaccc 
cccatgccca ggtcacttgg cacaagcgtg 

40 gcggctcacg gctgcggctg caccatgtgt 
999t9atggg cagctctggc cccctggagg 
gctcaagtgc tgtccacgtc cccgccccag 
cctcctcccg agtggcagaa gggcagaccc 
cccacgccca ggtcacatgg cacaagcgtg 

45 acggcccact gctgaggctg aaccaggtgt 
aagtgaccgg aagctcaggc accctggagg 
gcccaggacc cattcctgct ccaggactgg 
cacacgtgac tgaagggcag actctggatc 
cccaggtcac gtggtacaag cgcgggggca 

50 cccagctgcg gctccacctc gtctcccctg 
ccagcggccc aggccctgag caagaagcct 
ggtcttccta ccgccttagg agcccggtca 
agcagggcca ggatgccagc ttcaagtgcc 
tcgagtggaa gacccggaac caggagctgg 

55 ccatcatcac catcgtgggc acccggccca 
ccaatgccta cggtgtggcc cagagtgtgg 
tgtccgtgct ccccgagggc cccgtgtggg 
gtgtcagtgc cggggagccc cgctcctctg 



gcacagacat cgcgacactg ctcatcccag 6120 
tctgcgtggc caccagccct gcaggcactg 6180 
cagcctcaga cgccagccca ccgggggtca 6240 
aagggcaaac actcgacctc aactgtgtgg 63 00 
ggtacaggcg agggggtagc ctgcctcccc 6360 
tcccccaggt ctcaccagct gattctggag 6420 
gccccaagga ggcctccatt actgtgtctg 6480 
acaccccagt gcccggcagc acccggccca 6540 
cggaagggca gaccctggat ctgaactgcg 6600 
cgtggcacaa gcgtgggggc agcctccctg 6660 
ggctgcacca ggtgaccccg gccgactcag 6720 
ccggccccct agaggcctca gtcctggtca 6780 
tcccacctgt caggatcgag tcttcatcct 6840 
tgagctgcgt ggtggcaggg caggcccacg 6900 
gcctccctgc ccggcaccag gttcgtggct 6960 
ccgatgcggg acagtacgtc tgccgggcca 7020 
cagtaactgg gacccagggg gccaacttag 7080 
gcatcgagcc ctcctcctcg caagtggcgg 7140 
tgcccgggca gtcccatgcc caggtcacgt 7200 
ggcaccagac ccacggctcc ctgctgagac 7260 
agtacgtgtg ccgagtgttg ggcagctccg 7320 
ttgagcctgc gggctcagtg cctgcacttg 73 80 
cgtcttcgca agtggccgag gggcagaccc 7440 
cccatgccca ggtcacgtgg cacaagcgcg 7500 
atggctcgag gctacgcctg ctccaggtga 7560 
gtgtggtcgg cagctcaggt acccaggaag 7620 
ttagtggctc ccactcccag ggtgtggcgt 7680 
ccctggccaa tggacacacc ctggacctca 7740 
ccatcacctg gtataagcgt ggaggcagct 7800 
ggctgcggat ccctcaggtg actccggcag 7860 
acggtgcagg ctcccgggag acctcgctca 7920 
acgtgcccag cgtctcccca ccgatcagga 7980 
ggcagacctt ggatctgaac tgcgtggtcg 8040 
acaagcgtgg gggcagcctt ccctcccgac 8100 
accaaatgtc tgtggctgac tcgggcgagt 8160 
ccctggaggc ctccatcgtc atctccgtct 8220 
gcagctccat gcccatcaga attgagtcat 8280 
tggatctgaa ctgcgtggtc cccgggcagg 8340 
ggggcagcct ccccagtcac catcagaccc 8400 
ccccggccga ctcgggtgaa tacgtgtgcc 8460 
cctcagtcct ggtcaccatc gaagcctctg 8520 
gtggagcccc acccatccgc atcgagccct 8580 
tggatctgaa gtgcgtggtg cccgggcagg 8640 
gaggaaacct ccctgcccgg caccaggtcc 8700 
ccccggctga ctctggcgag tactcgtgcc 8760 
catctgtcct ggtcacaatt gagccctcca 8820 
cccagcccat ctacatcgag gcctcctctt 8880 
tgaactgtgt ggtgcccggg caggcccatg 8940 
gcctccccgc ccggcaccag acccatggct 9000 
ccgactcagg cgagtatgtg tgtcgtgcag 9060 
ccttcacagt caccgtcccg cccagtgagg 9120 
tctccatcga cccgcccagc agcaccgtgc 9180 
tcatccatga cggggcagcc cccatcagcc 9240 
aggacaacgt ccacatcagt cccaatggct 93 00 
gcaaccacgg tacctaccgc tgcgtggcct 93 60 
tgaacctcag tgtgcacggg ccccctacag 9420 
tgaaagtggg aaaggctgtc accctggagt 9480 
ctcgttggac ccggatcagc agcacccctg 9540 
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ccaagttgga gcagcggaca tatgggctca 
cagctaaacc atcagatgcg ggcacttatg 
cacagaagca ggtggaggtg atcgtggaca 
tccaagctga agaagctgag ctgactgtgg 
5 cagccacagg cagccccgcg cccaccatcc 
ggcagcaccg gctggaaggc gacacactca 
gccagtacat ctgcaatgcc actagccctg 
acgtggagag cccaccatat gccaccacgg 
agacggtgca gctccagtgc ctggctcacg 
10 gcgtgggcag cagccttcct gggagggcga 
gtgcagcccc tgaggactca ggccgctacc 
ccgaggcctt tgcccagctg ctcgtccaag 
tcccagcagg gtccacgccc accgtgcagg 
gggccagcgt tgagttccac tgtgctgtgc 
15 tcaaggaagg gggtcagctg cctccgggtc 
agaacttgga ccagagctgc caagggacgt 
aggcccaggc cagtgcccag ctggttatcc 
ggacctctgt gcagaccgtg gtggttggcc 
gtgaccccaa gcctcaggtg acatggagca 
20 tgcagagcgg aggtgtcgtc aggatcgccc 
gctgcactgc caccaacgca gctggcacca 
ccttgcccca gatctcaatg ccccaagaag 
tcccctgcat agcctcaggc taccccactc 
gcctgccacc tgacagccgc ctggagaaca 
25 aggacgcagg tacctacgtc tgcaccgcca 
cccacctgca ggtgccagag cgggtggtgc 
taccgctgcc caccatcaag gatgcctaca 
ccgactcagc cgatgggatg ctgctgtaca 
ccaacctggc caaccggcag cccgacttca 
30 agttccggtt cgatgcaggc tcaggcatgg 
tgggccattt ccacaccgtg accctgctgc 
gtgacctggc cccggtcaat gggacctccc 
aggaactcta cctgggtggc tatcctgact 
gcggcttcat aggctgtgtc cgggagctgc 
35 acctcaacct cacggcgcac ggcatctccc 
agaatggcgg tcagtgccat gactctgaga 
gcttcaccgg gagccgctgt gagcactcgc 
ggcccgacgc cacctgtgtg aaccggcctg 
tgggccgctc ggggttgcgg tgtgaggaag 
40 gtgctggctc ctacctggca ctgcccgccc 
acgtggagtt caagccactc gcccctgacg 
ggcctgtgga ggacttcgtg tccctggcga 
agttggggtc agggctggcc gttctgcgga 
accgtgtgtc tgcagagcgt ctcaacaagg 
45 ctgtgctgcg ctcctcgccc ggcaagagcc 
tggggggtgt ggagccttcc gtgccactgt 
gcggctgtgt gggcgaggtg tcagtgaatg 
taggcagcca gggcatcggg caatgctatg 
aacatggtgc cacgtgcatg cccgctggcg 
50 gattcaaagg agacctgtgt gagcacgagg 
tgcatggggg cacctgccag ggcacccgct 
gctgccaaca aggctctgga catggcatag 
ggggcaatga tgcccctggg cagtacggag 
tccctggcca tgtcttctcc aggagcctgc 
55 ttcggaccag cacagccagt ggcctcctgc 
gccaaggcaa ggacttcatc agcctcgggc 
agctgggtag tggggaggcc cgcctggtct 
accgggtgac agcactgcgg gagggccgca 



tggacagcca cgcggtgctg cagatttcat 9600 
tgtgccttgc tcagaatgca ctaggcacag 9660 
cgggcgccat ggccccaggg gcccctcagg 9720 
aggctggaca cacggccacc ttgcgctgct 9780 
actggtccaa gctgcgttcc ccactgccct 9640 
tcataccccg ggtagcccag caggactcgg 9900 
ctgggcacgc tgaggccacc atcatcctgc 9960 
tcccagagca cgcttcggtg caggcagggg 10020 
ggacaccccc actcaccttc cagtggagcc 10080 
ccgccaggaa cgagctgctg cactttgagc 1014 0 
gctgccgggt caccaacaag gtgggctcag 10200 
gccctcccgg ctctctccct gccacctcca 10260 
tcacgcctca gctagagacc aagagcattg 10320 
ccagcgacca gggtacccag ctccgttggt 103 80 
acagcgtgca ggatggggtg ctccgaatcc 10440 
atatatgcca ggcccatgga ccttggggga 10500 
aagccctgcc ctcggtgctc atcaacatcc 10560 
acgccgtgga gttcgaatgc ctggcactgg 10620 
aagttggagg gcacctgcgg ccaggcattg 10680 
acgtagagct ggctgatgcg ggacagtatc 10740 
cacaatccca cgtcctgctg cttgtgcaag 10800 
tccgtgtgcc tgctggttct gcagctgtct 10860 
ctgacatcag ctggagcaag ctggatggca 10920 
acatgctgat gctgccctca gtccgacccc 10980 
ctaaccgcca gggcaaggtc aaagcctttg 11040 
cctacttcac gcagaccccc tactccttcc 11100 
ggaagttcga gatcaagatc accttccggc 11160 
atgggcagaa gcgagtccca gggagcccca 11220 
tctccttcgg cctcgtgggg ggaaggcccg 11280 
ccaccatccg ccatcccaca ccactggccc 11340 
gcagcctcac ccagggctcc ctgattgtgg 11400 
agggcaagtt ccagggcctg gatctgaacg 11460 
atggtgccat ccccaaggcg gggctgagca 11520 
gcatccaggg cgaggagatc gtcttccatg 11580 
actgccccac ctgtcgggac cggccctgcc 11640 
gcagcagcta cgtgtgcgtc tgcccagctg 11700 
aggccctgca ctgccatcca gaggcctgtg 11760 
acggtcgagg ctacacctgc cgctgccacc 11820 
gtgtgacagt gaccaccccc tcgctgtcgg 11880 
tcaccaacac acaccacgag ctacgcctgg 11940 
gggtcctgct gttcagcggg gggaagagcg 12000 
tggtgggcgg ccacctggag ttccgctatg 12060 
gcgccgagcc gctggccctg ggccgctggc 12120 
acggcagcct gcgggtgaat ggtggacgcc 12180 
agggcctcaa cctgcacacc ctgctctacc 12240 
ccccggccac caacatgagc gctcacttcc 123 00 
gcaaacggct ggacctcacc tacagtttcc 12360 
atagctcccc atgtgagcgc cagccttgcc 12420 
agtatgagtt ccagtgcctg tgtcgagatg 124 80 
agaacccctg ccagctccgt gaaccctgtc 12540 
gcctctgcct ccctggcttc tctggcccac 12600 
cagagtccga ctggcatctt gaaggcagcg 12660 
cctatttcca cgatgatggc ttcctcgcct 12720 
ccgaggtgcc cgagaccatc gagctggagg 12780 
tctggcaggg tgtggaggtg ggagaggccg 12840 
ttcaagacgg gcaccttgtc ttcaggtacc 12900 
ctgaggaccc catcaatgac ggcgagtggc 12960 
gaggttccat ccaagtcgac ggtgaggagc 13020 
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tggtcagcgg ccggtcccca ggtcccaacg tggcagtcaa cgccaagggc agcgtctaca 13080 
tcggcggagc ccctgacgtg gccacgctga ccgggggcag attctcctcg ggcatcacag 13140 
gctgtgtcaa gaacctggtg ctgcactcgg cccgacccgg cgccccgccc ccacagcccc 13200 
tggacctgca gcaccgcgcc caggccgggg ccaacacacg cccctgcccc tcgtaggcac 13260 
5 ctgcctgccc cacacggact cccgggccac gccccagccc gacaatgtcg agtatattat 13320 
tattaatatt attatgaatt tttgtaagaa accgaggcga tgccacgctt tgctgctacc 133 80 
gccctgggct ggactggagg tgggcatgcc accctcacac acacagctgg gcaaagccac 13440 
aaggctggcc agcaaggcag gttggatggg agtgggcacc tcagaaagtc accaggactt 13500 
ggggtcagga acagtggctg ggtgggccca gaactgcccc cactgtcccc ctacccaccg 13560 

10 atggagcccc cagatagagc tgggtggcct gtttctgcag cccttgggca gttctcactc 13620 
ctaggagagc caacctcggc ttgtgggctg gtgccccaca gctacctgag acgggcatcg 13680 
caggagtctc tgccacccac tcaggattgg gaattgtctt tagtgccggc tgtggagcaa 1374 0 
aaggcagctc acccctgggc aggcggtccc catccccacc agctcgtttt tcagcacccc 13800 
cacccacctc cacccagccc ctggcacctc ctctggcaga ctccccctcc taccacgtcc 13860 

15 tcctggcctg cattcccacc ccctcctgcc agcacacagc ctggggtccc tccctcaggg 13920 
gctgtaaggg aaggcccacc ccaactctta ccaggagctg ctacaggcag agcccagcac 13980 
tgatagggcc ccgcccaccg ggccccgccc accccaggcc acatccccac ccatctggaa 1404 0 
gtgaaggccc agggactcct ccaacagaca acggacggac ggatgccgct ggtgctcagg 14100 
aagagctagt gccttaggtg ggggaaggca ggactcacga ctgagagaga gaggaggggg 14160 

20 atatgaccac cctgccccat ctgcaggagc ctgaagatcc agctcaagtg ccatcctgcc 14220 
agtggccccc agactgtggg gttgggacgc ctggcctctg tgtcctagaa gggaccctcc 14280 
tgtggtcttt gtcttgattt ttcttaataa acggtgctat ccccgcc 14327 



25 <210> 58 
<211> 15 
<212> PRT 

<213> Homo sapiens 
30 <400> 58 

lie Pro Thr Gly Glu Pro Cys Pro Glu Pro Leu Arg Thr Tyr Gly 
1 5 10 15 



35 

<210> 59 
<211> 13 
<212> PRT 

<213> Homo sapiens 

40 

<400> 59 

lie Glu Ser Val Leu Ser Ser Ser Gly Lys Arg Leu Gly 
15 10 

45 

<210> 60 
<211> 18 
<212> PRT 
50 <213> Homo sapiens 

<400> 60 

Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser Ser 
15 10 15 

55 

Phe Ser 
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<210> 61 
<211> 15 
5 <212> PRT 

<213> Homo sapiens 

<400> 61 

Arg He Gin Ala Met He Pro Lys Gly Ala Leu Arg Val Ala Val 
10 1 5 * 10 15 



<210> 62 
15 <211> 15 
<212> PRT 

<213> Homo sapiens 
<400> 62 

20 Gly He Cys Gin Cys Leu Ala Glu Arg Tyr Ser Val He Leu Leu 
15 10 15 



25 <210> 63 

<211> 17 

<212> PRT 

<213> Homo sapiens 

30 <400> 63 

Glu Lys Met His Glu Gly Asp Glu Gly Pro Gly His His His Lys Pro 
1 5 10 15 

Gly 

35 



<210> 64 

40 <211> 13 

<212> PRT 

<213> Homo sapiens 

<400> 64 

45 Asp Leu Gin Asn Phe Leu Lys Lys Glu Asn Lys Asn Glu 
1 5 10 



50 <210> 65 
<211> 19 
<212> PRT 
<213> Homo 



sapiens 



55 <400> 65 

Val Lys Leu Gly His Pro Asp Thr Leu Asn Gin Gly Glu Phe Lys Glu 
15 10 15 



WO 01/05422 



70 



PCT/FR00/02057 



Leu Val Arg 



5 

<210> 66 
<211> 48 
<212> ADN 

<213> Homo sapiens 

10 

<400> 66 

ttywsntggg ayaaytgytt ygarggnaar gayccngcng tnathmgn 4 8 



15 <210> 67 
<211> 48 
<212> ADN 

<213> Homo sapiens 
20 <400> 67 

taywsnytnc cnaarwsnga rttygcngtn ccngayytng arytnccn 48 



<210> 68 
25 <211> 16 
<212> PRT 

<213> Homo sapiens 
<400> 68 

30 Phe Ser Trp Asp Asn Cys Phe Glu Gly Lys Asp Pro Ala Val lie Arg 
15 10 15 



35 <210> 69 
<211> 585 
<212> ADN 

<213> Homo sapiens 
40 <400> 69 

gaygcnccng gncartaygg ngcntaytty caygaygayg gnttyytngc nttyccnggn 60 

caygtnttyw snmgnwsnyt nccngargtn ccngaracna thgarytnga rgtnmgnacn 12 0 

wsnacngcnw snggnytnyt nytntggcar ggngtngarg tnggngargc nggncarggn 180 

aargayttya thwsnytngg nytncargay ggncayytng tnttymgnta ycarytnggn 24 0 

45 wsnggngarg cnmgnytngt nwsngargay ccnathaayg ayggngartg gcaymgngtn 300 

acngcnytnm gngarggnmg nmgnggnwsn mgncargtng ayggngarga rytngtnwsn 360 

ggnmgnwsnc cnggnccnaa ygtngcngtn aaygcnaarg gnwsngtnta yathggnggn 420 

gcnccngayg tngcnacnyt nacnggnggn mgnttywsnw snggnathac nggntgygtn 480 

aaraayytng tnytncayws ngcnmgnccn ggngcnccnc cnccncarcc nytngayytn 540 

50 carcaymgng cncargcngg ngcnaayacn mgnccntgyc cnwsn 585 



<210> 70 
<211> 597 
55 <212> ADN 

<213> Homo sapiens 



<400> 70 
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atgaartggg tntgggcnyt 

mgngtnwsnw snttymgngt 

taygcnatgg cnaaraarga 

ttywsngtng aygaracngg 

5 aayaaytggg aygtntgygc 

aarttyaara tgaartaytg 

tggathgtng ayacngayta 

ytngayggna cntgygcnga 

ccnccngarg cncaraarat 

10 taymgnytna thgtncayaa 



nytnytnytn gcngcntggg 
naargaraay ttygayaarg 
yccngarggn ytnttyytnc 
ncaratgwsn gcnacngcna 
ngayatggtn ggnacnttya 
gggngtngcn wsnttyytnc 
ygayacntay gcngtncart 
ywsntaywsn ttygtnttyw 
hgtnmgncar mgncargarg 
yggntaytgy gayggnmgnw 



cngcngcnga rmgngaytgy 60 
cnmgnttyws nggnacntgg 120 
argayaayat hgtngcngar 180 
arggnmgngt nmgnytnytn 24 0 
cngayacnga rgayccngcn 3 00 
araarggnaa ygaygaycay 360 
aywsntgymg nytnytnaay 420 
snmgngaycc naayggnytn 4 80 
arytntgyyt ngcnmgncar 540 
sngarmgnaa yytnytn 597 



<210> 71 

<211> 579 

15 <212> ADN 

<213> Homo sapiens 

<400> 71 

atgcarwsny tnatgcargc nccnytnytn athgcnytng gnytnytnyt ngcnacnccn 60 
20 gcncargcnc ayytnaaraa rccnwsncar ytnwsnwsnt tywsntggga yaaytgytty 120 
garggnaarg ayccngcngt nathmgnwsn ytnacnytng arccngaycc nathgtngtn 180 
ccnggnaayg tnacnytnws ngtngtnggn wsnacnwsng tnccnytnws nwsnccnytn 240 
aargtngayy tngtnytnga raargargtn gcnggnytnt ggathaarat hccntgyacn 300 
gaytayathg gnwsntgyac nttygarcay ttytgygayg tnytngayat gytnathccn 3 60 
25 acnggngarc cntgyccnga rccnytnmgn acntayggny tnccntgyca ytgyccntty 420 
aargarggna cntaywsnyt nccnaarwsn garttygcng tnccngayyt ngarytnccn 480 
wsntggytna cnacnggnaa ytaymgnath garwsngtny tnwsnwsnws nggnaartngn 540 
ytnggntgya thaarathgc ngcnwsnytn aarggnath 579 

30 

<210> 72 
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Human VCY2IP1 Protein sequence - var5 (public gi: 13938255) (seq id no: 319) 

DTDRDSSTSVSFEQVLPPSAPTSEAGLSLPLRGPRARRSASPHDVDLCLVSPCEFEHRKAVPMAPAPASP 
GSSNDSSARSQERAGGLGAEETPPTSVSESLPTLSDSDPVPLAPGAADSDEDTEGFGVPRHDPLPDPLKV 
PPPLPDPSSICMVDPEMLPPKTARQTENVSRTRKPLARPNSRAAAPKATPVAAAKTKGLAGGDRASRPLS 
ARSEPSEKGGRAPLSRKSSTPKTATRGPSGSASSRPGVSATPPKSPVYLDLAYLPSGSSAHLVDEEFFQR 
VRALCYVISGQDQRKEEGMRAVLDALLASKQHWDRDLQVTLIPTFDSVAMHTWYAETHARHQALGITVLG 
SNSMVSMQDDAFPACKVEF 

Human VCY2IP1 Protein sequence - var6 (public gi: 14042429) (seq id no: 320) 

MAAVAGSGAAAAPSSLLLWGSEFGSPGLLTYVLEELERGIRSWDVDPGVCNLDEQLKVFVSRHSATFSS 
IVKGQRSLHHRGDNLETLVLLNPSDKSLYDELRNLLLDPASHKLLVLAGLCLEETGELLLQTGGFSPHHF 
LQVLKDREIRDILATTPPPVQPPILTITCPTFGDWAQPAPAVPGLQGALRLQLRLNPPAQLPNSEGLCEF 
LEYVAESLEPPSPFELLEPPTSGGFLRLGRPCCYIFPGGLGDAAFFAVNGFTVLVNGGSNPKSSFWKLVR 
HLDRVDAVLVTHPGADSLPGLNSLLRRKLAERSEVAAGGGSWDDRLRRLISPNLGVVFFNACEAASRLAR 
GEDEAELALSLI^QLGITPLPLSRGPVPAKPWLFEKMGVGRLDMWLHPPSAGAERTI.ASVCALLVWHP 
AGPGEKWRVLFPGCTPPACLLDGLVRLQHLRFLREPWTPQDLEGPGRAESKESVGSRDSSKREGLLAT 
HPRPGQERPGVARKEPARAEAPRKTEKEAKTPRELRKDPKPSVSRTQPREVRRAASSVPNLKKTNAQAAP 
KPRKAPSTSHSGFPPVANGPRSPPSLRCGEASPPSAACGSPASQLVATPSLELGPIPAGEEKALELPLAA 
SSIPRPRTPSPESHRSPAEGSERLSLSPLRGGEAGPDASPTVTTPTVTTPSLPAEVGSPHSTEVDESLSV 
SFEQVLPPSAPTSEAGLSLPLRGPRARRSASPHDVDLCLVSPCEFEHRKAVPMAPAPASPGSSNDSSARS 
QERAGGLGAEETPPTSVSESLPTLSDSDPVPLAPGAADSDEDTEGFGVPRHDPLPDPLKVPPPLPDPSSI 
CMVDPEMLPPQDSTANGERQPHPEAPGPPQLTRCRPQSHSSGCCQNQGACWWGPCQPTTQCPE 

Human VCY2IP1 Protein sequence - var7 (public gi: 13623505) (seq id no: 321) 

MGVGRLDMYVLHPPSAGAERTLACVCALLWHPAGPGEKVVRVLFPGCTPPACLLDGLVRLQHLRFLREP 
WTPQDLEGPGRAESKESVGSRDSSKREGLLATHPRPGQERPGVARKEPARAEAPRKTEKEAKTPRELKK 
DPKPSVSRTQPREVRRAASSVPNLKKTNAQAAPKPRKAPSTSHSGFPPVANGPRSPPSLRCGEASPPSAA 
CGSPASQLVATPSLELGPIPAGEEKALELPLAASSIPRPRTPSPESHRSPAEGSERLSLSPLRGGEAGPD 
ASPTVTTPTVTTPSLPAEVGSPHSTEVDESLSVS FEQVLPPSAPTSEAGLSLPLRGPRARRSASPHDVDL 
CLVSPCEFEHRKAVPMAPAPAS PGSSNDSSARSQERAGGLGAEETPPTSVSESLPTLSDSDPVPLAPGAA 
DSDEDTEGFGVPRHDPLPDPLKVPPPLPDPSS I CMVDPEMLPPKTARQTENVSRTRKPLARPNSRAAAPK 
ATPVAAAKTKGLAGGDRASRPLSARSEPSEKGGRAPLSRKSSTPKTATRGPSGSASSRPGVSATPPKSPV 
YLDLAYLPSGSSAHLVDEEFFQRVRALCYVISGQDQRKEEGMRAVLDALLASKQHWDRDLQVTLIPTFDS 
VAMHTOYAETHARHQALGITVLGSNSMVSMQDDAFPACKVEF 

Human VCY2IP1 Protein sequence - var8 (public gi: 10434894) (seq id no: 322) 

MGVGRLDMYVLHPPSAGAERTLASVCALLVWHPAGPGEKWRVLFPGCTPPACLLDGLVRLQHLRFLREP 
WTPQDLEGPGRAESKESVGSRDSSKREGLLATHPRPGQERPGVARKEPARAEAPRKTEKEAKTPRELKK 
DPKPSVSRTQPREVRRAASSVPNLKKTNAQAAPKPRKAPSTSHSGFPPVANGPRSPPSLRCGEASPPSAA 
CGSPASQLVATPSLELGPIPAGEEKALELPLAASSIPRPRTPSPESHRSPAEGSERLSLSPLRGGEAGPD 
ASPTVTTPTVTTPSLPAEVGS PHSTEVDESLSVSFEQVLPPSAPTSEAGLSLPLRGPRARRSAS PHDVDL 
CLVSPCEFEHRKAVPMAPAPAS PGSSNDSSARSQERAGGLGAEETPPTSVSESLPTLSDSDPVPLAPGAA 
DSDEDTEGFGVPRHDPLPDPLKVPPPLPDPSS I CMVDPEMLPPKTARQTENVSRTRKPLARPNSRAAAPK 
ATPVAAAKTKGLAGGDRASRPLSARSEPSEKGGRAPLSRKSSTPKTATRGPSGSASSRPGVSATPPKSPV 
YLDLAYLPSGSSAHLVDEELFQRVRALCYVISGQDQRKEEGMRAVLDALLASKQHWDRDLQVTLIPTFDS 
VAMHTWYAETHARHQALGITVLGSNSMVSMQDDAFPACKVEF 

Human VCY2IP1. Protein sequence - var9 (public gi: 7022844) (seq id no: 323) 

MGVGRLDMYVLHP PS AGAERTLAS VCALLVWH PAGPGE KWRVLFPGCTP PACLLDGLVRLQHLRFLREP 
WTPQDLEGPGRAESKESVGSRDSSKREGLLATHPRPGQERPGVARKEPARAEAPRKTEKEAKTPRELKK 
DPKPSVSRTQPREVRRAASSVPNLKKTNAQAAPKPRKAPSTSHSGFPPVANGPRSPPSLRCGEASPPSAA 
CGSPASQLVATPSLELGPIPAGEEKALELPLAASSIPRPRTPSPESHRSPAEGSERLSLSPLRGGEAGPD 
AS PTVTTPTVTTPSLPAEVGSPHSTEVDESLSVSFEQVLPPSAPTSEAGLSLPLRGPRARRSAS PHDVDL 
CLVSPCEFEHRKAVPMAPAPAS PGSSNDSSARSQERAGGLGAEETPPTSVSESLPTLSDSDPVPLAPGAA 
DSDEDTEGFGVPRHDPLPDPLKVPPPLPDPSSICMVDPEMLPPKTARQTENVSRTRKPLARPNSRAAAPK 
ATPVAAAKTKGLAGGDRASRPLSARSEPSEKGGRAPLSRKSSTPKTATRGPSGSASSRPGVSATPPKSPV 
YLDLAYLPSGSSAHLVDEEFFQRVRALCYVISGQDQRKEEGMRAVLDALLASKQHWDRDLQVTLIPTFDS 
VAMHTWYAETHARHQALGITVLGSNGMVSMQDDAFPACKVEF 
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Unigene Name: SPG20 Unigene ID: Hs . 118087 



Human SPG20 raRNA sequence - varl (public gi: 28436884) 

AGTGTAAGGGAGTGGGAGCTGGTCCGTGCCGCGGCGGCCGCGCAGGGAGCTCTCGAGGCAACGCCGGGGC 
GCCCGAGGTCTGGAAGGCGCAGAAATGGAGCAAGAGCCACAAAATGGAGAACCTGCTGAAATTAAGATCA 
TCAGAGAAGCATATAAGAAGGCCTTTTTATTTGTTAACAAAGGTCTGAATACAGATGAATTAGGTCAGAA 
GGAAGAAGCAAAGAACTACTATAAGCAAGGAATAGGACACCTGCTCAGAGGGATCAGCATTTCATCAAAA 
GAGTCTGAACACACAGGTACTGGGTGGGAATCTGCTAGACAGATGCAACAGAAAATGAAAGAAACTCTAC 
AGAATGTACGCACCAGGCTGGAAATTCTAGAGAAGGGTCTTGCCACTTCTCTGCAGAATGATCTTCAGGA 
GGTGCCCAAGTTATATCCAGAATTTCCACCTAAAGACATGTGTGAAAAATTACCAGAGCCTCAGTCTTTT 
AGTTCAGCTCCTCAGCATGCTGAAGTAAATGGAAACACCTCAACTCCAAGTGCAGGGGCAGTTGCTGCAC 
CTGCTTCTCTGTCTTTACCATCACAAAGTTGTCCAGCAGAAGCTCCTCCTGCTTATACTCCTCAAGCTGC 
TGAAGGTCACTACACTGTATCCTATGGAACAGATTCTGGGGAGTTTTCATCAGTTGGAGAGGAGTTTTAT 
AGGAATCATTCTCAGCCACCGCCTCTTGAGACCTTAGGGCTGGATGCAGATGAATTGATTTTGATACCAA 
ATGGAGTACAGATTTTTTTTGTAAATCCTGCAGGGGAGGTTAGTGCACCTTCGTATCCTGGGTACCTTCG 
AATTGTGAGGTTTTTGGATAATTCTCTCGATACGGTTCTAAACCGTCCTCCCGGGTTTCTTCAGGTTTGT 
GACTGGTTATATCCTCTAGTTCCTGATAGATCTCCGGTTCTGAAATGTACTGCGGGAGCCTACATGTTTC 
CTGATACAATGCTACAAGCAGCAGGATGCTTTGTGGGGGTCGTCCTGTCCTCTGAGTTACCAGAGGATGA 
TAGAGAGCTCTTTGAGGATCTGTTAAGGCAAATGTCTGACCTTCGGCTCCAGGCCAACTGGAACAGAGCA 
GAAGAAGAAAATGAATTCCAAATCCCTGGAAGAACTAGACCCTCCTCTGACCAACTAAAAGAAGCCTCTG 
GCACTGATGTGAAACAGTTGGACCAAGGCAATAAGGATGTACGTCATAAAGGAAAACGTGGAAAAAGGGC 
TAAAGATACTTCAAGTGAAGAAGTTAACCTGAGTCACATTGTACCATGTGAGCCAGTTCCAGAAGAAAAG 
CCAAAAGAATTACATGAATGGAGTGAAAAAGTGGCTCACAACATTTTGTCAGGTGCTTCCTGGGTGAGTT 
GGGGTTTAGTCAAAGGTGCTGAGATTACTGGTAAGGCAATCCAGAAAGGTGCTTCTAAACTCCGAGAGCG 
GATTCAACCAGAAGAAAAACCCGTGGAAGTTAGTCCAGCTGTCACCAAGGGACTTTATATAGCGAAGCAA 
GCTACAGGAGGAGCAGCAAAAGTCAGTCAGTTCCTGGTTGATGGAGTTTGCACTGTAGCAAATTGCGTTG 
GAAAAGAACTAGCTCCACATGTCAAGAAGCATGGAAGCAAACTTGTTCCAGAATCTCTTAAAAAAGACAA 
AGATGGGAAATCTCCTCTGGATGGTGCTATGGTTGTAGCAGCGAGTAGTGTTCAAGGATTTTCAACTGTC 
TGGCAAGGATTGGAATGTGCAGCTAAATGCATCGTTAACAATGTTTCAGCAGAAACTGTACAAACTGTCA 
GATACAAATACGGATATAATGCAGGAGAAGCTACCCACCATGCGGTGGATTCTGCGGTCAATGTTGGCGT 
AACTGCCTACAATATTAACAACATTGGTATCAAAGCAATGGTGAAGAAAACTGCAACACAAACAGGACAC 
ACTCTCCTTGAGGACTATCAGATAGTTGATAATTCTCAGAGGGAAAATCAAGAAGGAGCAGCAAATGTCA 
ACGTGAGAGGGGAGAAGGATGAGCAGACGAAGGAAGTAAAGGAGGCAAAGAAGAAAGATAAATGATGAAG 
TGCTGGGAATCACTTATACCAAAGCCTTATGAAATGGATGAAATTTTGTTAAATAGGCAAATGTGGAATT 
CCTCACAGATTAACCAGTATTTTTTAAATGTATTCATTCCTACAAATTAACTTTCATAAATTTTATGGCA 
TGTCTTCTATTTAAAAGGAAAAGAATAAGTATTCTTGCATCTGGCCTTAGAAATGTGAAGTTATATTCTC 
AAGTTTATTTTTTTCCAAGTGTAGCTAAAATATTTTTGCAGGTAAAATAAAGCTGATAGTACATGTGTTG 
TTCAAACCTTGTTAAACCTAATATTGAACTATTTTTATATCTGCTGTCTTTCAGAAGGCAAATAGGAAAC 
TATATATTTGCTTAAAAATTGGCATTTAGTAACCTTAATTCTTTTTATAGAAGGAATGACTTAAAGTATT 
GTCCCCTCTTTTTGCACTAATTGTGGATTTTTTTAGATGCTTCTCAAAATTTTCAGTGTGTAAGCTAAAC 
AAAAACTAAAACTAAGAATTCTCAAAAAGACTTGTTCAAAACAGGGAAAGACTGATGAAAAGTAAAATGG 
ACTACTTTTGTAACTTACCTGTTTGTTAGGAAATGGAATGGTTTCTTTGATTTAAAATGAATAAAAATAG 
ATTATTACGTCTTTTGTATTGAGACTGTATTGTTATGAGCCTAGGAAATTTGGGAACATGATTGTATTGT 
ATTAAAATTCGAAGTGATTATTATCAGCTTAATTGGATTAAAAAAGTACTTCAAGAAATTAAAAAAAAAA 
AAAAAAAAAAAATAAAAAAAAAAAAAAA 

Human SPG20 raRNA sequence - var2 (public gi: 7023530) 

AGGGAGCTCTCGAGGCAACGCCGGGGCGCCCGAGGTCTGGAAGGCGCAGAAATGGAGCAAGAGCCACAAA 
ATGGAGAACCTGCTGAAATTAAGATCATCAGAGAAGCATATAAGAAGGCCTTTTTATTTGTTAACAAAGG 
TCTGAATACAGATGAATTAGGTCAGAAGGAAGAAGCAAAGAACTACTATAAGCAAGGAATAGGACACCTG 
CTCAGAGGGATCAGCATTTCATCAAAAGAGTCTGAACACACAGGTCCTGGGTGGGAATCTGCTAGACAGA 
TGCAACAGAAAATGAAAGAAACTCTACAGAATGTACGCACCAGGCTGGAAATTCTAGAGAAGGGTCTTGC 
CACTTCTCTGCAGAATGATCTTCAGGAGGTGCCCAAGTTATATCCAGAATTTCCACCTAAAGACATGTGT 
GAAAAATTACCAGAGCCTCAGTCTTTTAGTTCAGCTCCTCAGCATGCTGAAGTAAATGGAAACACCTCAA 
CTCCAAGTGCAGGGGCAGTTGCTGCACCTGCTTCTCTGTCTTTACCATCACAAAGTTGTCCAGCAGAAGC 
TCCTCCTGCTTATACTCCTCAAGCTGCTGAAGGTCACTACACTGTATCCTATGGAACAGATTCTGGGGAG 
TTTTCATCAGTTGGAGAGGAGTTTTATAGGAATCATTCTCAGCCACCGCCTCTTGAGACCTTAGGGCTGG 
ATGCAGATGAATTGATTTTGATACCAAATGGAGTACAGATTTTTTTTGTAAATCCTGCAGGGGAGGTTAG 
TGCACCTTCGTATCCTGGGTACCTTCGAATTGTGAGGTTTTTGGATAATTCTCTCGATACGGTTCTAAAC 
CGTCCTCCCGGGTTTCTTCAGGTTTGTGACTGGTTATATCCTCTAGTTCCTGATAGATCTCCGGTTCTGA 
AATGTACTGCGGGAGCCTACATGTTTCCTGATACAATGCTACAAGCAGCAGGATGCTTTGTGGGGGTCGT 
CCTGTCCTCTGAGTTACCAGAGGATGATAGAGAGCTCTTTGAGGATCTGTTAAGGCAAATGTCTGACCTT 



Figure 36 part - 143 



CGGCTCCAGGCCAACTGGAACAGAGCAGAAGAAGAAAATGAATTCCAAATCCCTGGAAGAACTAGACCCT 
CCTCTGACCAACTAAAAGAAGCCTCTGGCACTGATGTGAAACAGTTGGACCAAGGCAATAAGGATGTACG 
TCATAAAGGAAAACGTGGAAAAAGGGCTAAAGATACTTCAAGTGAAGAAGTTAACCTGAGTCACATTGTA 
CCATGTGAGCCAGTTCCAGAAGAAAAGCCAAAAGAATTACCTGAATGGAGTGAAAAAGTGGCTCACAACA 
TTTTGTCAGGTATTACAGTAATGTTAATTTTTTTCCCTGTATGACATTAAGCCTTTGGAACCAAATAAAG 
ATATTGTTTATTAGGGAATACTGAGAAAGATAATATTTTGTATTTTGGTTTTAAATGATCAATTTAGAAA 
TAAATGTAGAAGGAACTAGTCTTTTGAAACATCAGATATTGTCATATAAGTATAAATTCTTCCTGGCCTA 
TTATTCTGTTTTACTATTGGGAAAATGGATAGTGAAAAGCTTCAGGAATCTTCAAATTCTTAATAGTTCT 
GAATCTAAAATTAGTTATGTTCGTTTCCCCTTTGAAGCTCCCTCTTAACCTCCCCCTACCCCTGTCCCTC 
AGCTGTGGTCTGAATGTGTCCCTTCAAAATTCATATATTGAAATCCTAACCCCTGAGGTGATGGTTTTAG 
GAGGTGGGGCCTTTGGAAGGTGATTAGGTCATGAGGGAGGAGCCCTCATCAATGGGATTAGTCCCTTATA 
AAAGAGATCCCAAAGAGCTGCCTTGTCCCTTTCACTATGTGAGGAAGCAGTAAGAAGGTGTCATTCTATG 
AACCAGGAAGTGGGCCCCTCACCAGAGACCAAATGTACCAGCACCTTAGTCTTGTACTTCCCAGCCTCTA 
GAATTGTGAGAAATAAATTTTTGTTGTTAAT 

Human SPG20 mRNA sequence - var3 (public gi: 7023938) 

GATAATTCTCTCGATACGGTTCTAAACCGTCCTCCCGGGTTTCTTCAGGTTTGTGACTGGTTATATCCTC 
TAGTTCCTGATAGATCTCCGGTTCTGAAATGTACTGCGGGAGCCTACATGTTTCCTGATACAATGCTACA 
AGCAGCAGGATGCTTTGTGGGGGTCGTCCTGTCCTCTGAGTTACCAGAGGATGATAGAGAGCTCTTTGAG 
GATCTGTTAAGGCAAATGTCTGACCTTCGGCTCCAGGCCAACTGGAACAGAGCAGAAGAAGAAAATGAAT 
TCCAAATCCCTGGAAGAACTAGACCCTCCTCTGACCAACTAAAAGAAGCCTCTGGCACTGATGTGAAACA 
GTTGGACCAAGGCAATAAGGATGTACGTCATAAAGGAAAACGTGGAAAAAGGGCTAAAGATACTTCAAGT 
GAAGAAGTTAACCTGAGTCACATTGTACCATGTGAGCCAGTTCCAGAAGAAAAGCCAAAAGAATTACCTG 
AACGGAGTGAAAAAGTGGCTCACAACATTTTGTCAGGTGCTTCCTGGGTGAGTTGGGGTTTAGTCAAAGG 
TGCTGAGATTACTGGTAAGGCAATCCAGAAAGGTGCTTCTAAACTCCGAGAGCGGATTCAACCAGAAGAA 
AAACCCGTGGAAGTTAGTCCAGCTGTCACCAAGGGACTTTATATAGCGAAGCAAGCTACAGGAGGAGCAG 
CAAAAGTCAGTCAGTTCCTGGTTGATGGAGTTTGCACTGTAGCAAATTGCGTTGGAAAAGAACTAGCTCC 
ACATGTCAAGAAGCATGGAAGCAAACTTGTTCCAGAATCTCTTAAAAAAGACAAAGATGGGAAATCTCCT 
CTGGATGGTGCTATGGTTGTAGCAGCAAGTAGTGTTCAAGGATTTTCAACTGTCTGGCAAGGATTGGAAT 
GTGCAGCTAAATGCATCGTTAACAATGTTTCAGCAGAAACTGTACAAACTGTCAGATACAAATACGGATA 
TAATGCAGGAGAAGCTACCCACCATGCGGTGGATTCTGCGGTCAATGTTGGCGTAACTGCCTACAATATT 
AACAACATTGGTATCAAAGCAATGGTGAAGAAAACTGCAACACAAACAGGACACACTCTCCTTGAGGACT 
ATCAGATAGTTGATAATTCTCAGAGGGAAAATCAAGAAGGAGCAGCAAATGTCAACGTGAGAGGGGAGAA 
GGGTGAGCAGACGAAGGAAGTAAAGGAGGCAAAGAAGAAAGATAAATGATGAAGTGCTGGGAATCACTTA 
TACCAAAGCCTTATGAAATGGATGAAATTTTGTTAAATAGGCAAATGTGGAATTCCTCACAGATTAACCA 
GTATTTTTTAAATGTATTCATTCCTACAAATTAACTTTCATAAATTTTATGGCATGTCTTCTATTTAAAA 
GGAAAAGAATAAGTATTCTTGCATCTGGCCTTAGAAATGTGAAGTTATATTCTCAAGTTTATTTTTTTCC 
AAGTGTAGCTAAAATATTTTTGCAGGTAAAATAAAGCTGATAGTACATGTGTTGTTCAAACCTTGTTAAA 
CCTAATATTGAACTATTTTTATATCTGCTGTCTTTCAGAAGGCAAATAGGAAACTATATATTTGCTTAAA 
AATTGGCATTTAGTAACCTTAATTCTTTTTATAGAAGGAATGACTTAAAGTATTGTCCCCTCTTTTTGCA 
CTAATTGTGGATTTTTTTAGATGCTTCTCAAAATTTTCAGTGTGTAAGCTAAACAAAAACTAAAACTAAG 
AATTCTCAAAAAAACTTGTTCAAAACAGGGAAAGACTGATGAAAAGTAAAATGGACTACTTTTGTAACTT 
ACCTGTTTGTTAGGAAATGGAATGGTCTCTTTGATTTAAAATGAATAAAAATAGATTATTACGTC 

Human SPG20 mRNA sequence - var4 (public gi: 16553694) 

GTGCATGTTTTCTTCAGTCCTGGAAGGAAATCATAAGTGATTTGCCCCAAAAGGATTGCTGTTGAAAATG 
GAGCAAGAGCCACAAAATGGAGAACCTGCTGAAATTAAGATCATCAGAGAAGCATATAAGAAGGCCTTTT 
TATTTGTTAACAAAGGTCTGAATACAGATGAATTAGGTCAGAAGGAAGAAGCAAAGAACTACTATAAGCA 
AGGAATAGGACACCTGCTCAGAGGGATCAGCATTTCATCAAAAGAGTCTGAACACACAGGTCCTGGGTGG 
GAATCTGCTAGACAGATGCAACAGAAAATGAAAGAAACTCTACAGAATGATCTTCGTATCCTGGGTACCT 
TCGAATTGTGAGGTTTTTGGATAATTCTCTCGATACGGTTCTAAACCGTCCTCCCGGGTTTCTTCAGGTT 
TGTGACTGGTTATATCCTCTAGTTCCTGATAGATCTCCGGTTCTGAAATGTACTGCGGGAGCCTACATGT 
TTCCTGATACAATGCTACAAGCAGCAGGATGCTTTGTGGGGGTCGTCCTGTCCTCTGAGTTACCAGAGGA 
TGATAGAGAGCTCTTTGAGGATCTGTTAAGGCAAATGTCTGACCTTCGGCTCCAGGCCAACTGGAACAGA 
GCAGAAGAAGAAAATGAATTCCAAATCCCTGGAAGAACTAGACCCTCCTCTGACCAACTAAAAGAAGCCT 
CTGGCACTGATGTGAAACAGTTGGACCAAGGCAATAAGGATGTACGTCATAAAGGAAAACGTGGAAAAAG 
GGCTAAAGATACTTCAAGTGAAGAAGTTAACCTGAGTCACATTGTACCATGTGAGCCAGTTCCAGAAGAA 
AAGCCAAAAGAATTACCTGAATGGAGTGAAAAAGTGGCTCACAACATTTTGTCAGGTGCTTCCTGGGTGA 
GTTGGGGTTTAGTCAAAGGTGCTGAGATTACTGGTAAGGCAATCCAGAAAGGTGCTTCTAAACTCCGAGA 
GCGGATTCAACCAGAAGAAAAACCCGTGGAAGTTAGTCCAGCTGTCACCAAGGGACTTTATATAGCGAAG 
CAAGCTACAGGAGGAGCAGCAAAAGTCAGTCAGTTCCTGGTTGATGGAGTTTGCACTGTAGCAAATTGCG 
TTGGAAAAGAACTAGCTCCACATGTCAAGAAGCATGGAAGCAAACTTGTTCCAGAATCTCTTAAAAAAGA 
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CAAAGATGGGAAATCTCCTCTGGATGGTGCTATGGTTGTAGCAGCAAGTAGTGTTCAAGGATTTTCAACT 
GTCTGGCAAGGATTGGAATGTGCAGCTAAATGCATCGTTAACAATGTTTCAGCAGAAACTGTACAAACTG 
TCAGATACAAATACGGATAATGCAGGAGAAGCTACCCACCATGCGGTGGATTCTGCGGTCAATGTTGGCG 
TAACTGCCTACAATATTGACAACATTGGTATCAAAGCAATGGTGAAGAAAACTGCAACACAAACAGGACA 
CACTCTCCTTGAGGACTATCAGATAGTTGATAATTCTCAGAGGGAAAATCAAGAAGGAGCAGCAAATGTC 
AACGTGAGAGGGGAGAAGGATGAGCAGACGAAGGAAGTAAAGGAGGCAAAGAAGAAAGATAAATGATGAA 
GTGCTGGGAATCACTTATACCAAAGCCTTATGAAATGGATGAAATTTTGTTAAATAGGCAAATGTGGAAT 
TCCTCACAGATTAACCAGTATTTTTTAAATGTATTCATTCCTACAAATTAACTTTCATAAATTTTATGGC 
ATGTCTTCTATTTAAAAGGAAAAGAATAAGTATTCTTGCATCTGGCCTTAGAAATGTGAAGTTATATTCT 
CAAGTTTATTTTTTTCCAAGTGTAGCTAAAATATTTTTGCAGGTAAAATAAAGCTGATAGTACATGTGTT 
GTTCAAACCTTGTTAAACCTAATATTGAACTATTTTTATATCTGCTGTCTTTCAGAAGGCAAATAGGAAA 
CTATATATTTGCTTAAAAATTGGCATTTAGTAACCTTAATTCTTTTTATAGAAGGAATGACTTAAAGTAT 
TGTCCCCTCTTTTTGCACTAATTGTGGATTTTTTTAGATGCTTCTCAAAATTTTCAGTGTGTAAGCTAAA 
CAAAAACTAAAACTAAGAATTCTCAAAAAAACTTGTTCAAAACAGGGAAAGACTGATGAAAAGTAAAATG 
GACTACTTTTGTAACTTACCTGTTTGTTAGGAAATGGAATGGTCTCTTTGATTTAAAATGAATAAAAATA 
GATTATTACGTC 

Human SPG20 mRNA sequence - var5 (public gi: 21654722) 

ATGGAGCAAGAGCCACAAAATGGAGAACCTGCTGAAATTAAGATCATCAGAGAAGCATATAAGAAGGCCT 
TTTTATTTGTTAACAAAGGTCTGAATACAGATGAATTAGGTCAGAAGGAAGAAGCAAAGAACTACTATAA 
GCAAGGAATAGGACACCTGCTCAGAGGGATCAGCATTTCATCAAAAGAGTCTGAACACACAGGTCCTGGG 
TGGGAATCTGCTAGACAGATGCAACAGAAAATGAAAGAAACTCTACAGAATGTACGCACCAGGCTGGAAA 
TTCTAGAGAAGGGTCTTGCCACTTCTCTGCAGAATGATCTTCAGGAGGTGCCCAAGTTATATCCAGAATT 
TCCACCTAAAGACATGTGTGAAAAATTACCAGAGCCTCAGTCTTTTAGTTCAGCTCCTCAGCATGCTGAA 
GTAAATGGAAACACCTCAACTCCAAGTGCAGGGGCAGTTGCTGCACCTGCTTCTCTGTCTTTACCATCAC 
AAAGTTGTCCAGCAGAAGCTCCTCCTGCTTATACTCCTCAAGCTGCTGAAGGTCACTACACTGTATCCTA 
TGGAACAGATTCTGGGGAGTTTTCATCAGTTGGAGAGGAGTTTTATAGGAATCATTCTCAGCCACCGCCT 
CTTGAGACCTTAGGGCTGGATGCAGATGAATTGATTTTGATACCAAATGGAGTACAGATTTTTTTTGTAA 
ATCCTGCAGGGGAGGTTAGTGCACCTTCGTATCCTGGGTACCTTCGAATTGTGAGGTTTTTGGATAATTC 
TCTCGATACGGTTCTAAACCGTCCTCCCGGGTTTCTTCAGGTTTGTGACTGGTTATATCCTCTAGTTCCT 
GATAGATCTCCGGTTCTGAAATGTACTGCGGGAGCCTACATGTTTCCTGATACAATGCTACAAGCAGCAG 
GATGCTTTGTGGGGGTCGTCCTGTCCTCTGAGTTACCAGAGGATGATAGAGAGCTCTTTGAGGATCTGTT 
AAGGCAAATGTCTGACCTTCGGCTCCAGGCCAACTGGAACAGAGCAGAAGAAGAAAATGAATTCCAAATC 
CCTGGAAGAACTAGACCCTCCTCTGACCAACTAAAAGAAGCCTCTGGCACTGATGTGAAACAGTTGGACC 
AAGGCAATAAGGATGTACGTCATAAAGGAAAACGTGGAAAAAGGGCTAAAGATACTTCAAGTGAAGAAGT 
TAACCTGAGTCACATTGTACCATGTGAGCCAGTTCCAGAAGAAAAGCCAAAAGAATTACCTGAATGGAGT 
GAAAAAGTGGCTCACAACATTTTGTCAGGTGCTTCCTGGGTGAGTTGGGGTTTAGTCAAAGGTGCTGAGA 
TTACTGGTAAGGCAATCCAGAAAGGTGCTTCTAAACTCCGAGAGCGGATTCAACCAGAAGAAAAACCCGT 
GGAAGTTAGTCCAGCTGTCACCAAGGGACTTTATATAGCGAAGCAAGCTACAGGAGGAGCAGCAAAAGTC 
AGTCAGTTCCTGGTTGATGGAGTTTGCACTGTAGCAAATTGCGTTGGAAAAGAACTAGCTCCACATGTCA 
AGAAGCATGG/^AGCAAACTTGTTCCAGAATCTCTTAAAAAAGACAAAGATGGGAAATCTCCTCTGGATGG 
TGCTATGGTTGTAGCAGCAAGTAGTGTTCAAGGATTTTCAACTGTCTGGCAAGGATTGGAATGTGCAGCT 
AAATGCATCGTTAACAATGTTTCAGCAGAAACTGTACAAACTGTCAGATACAAATACGGATATAATGCAG 
GAGAAGCTACCCACCATGCGGTGGATTCTGCGGTCAATGTTGGCGTAACTGCCTACAATATTAACAACAT 
TGGTATCAAAGCAATGGTGAAGAAAACTGCAACACAAACAGGACACACTCTCCTTGAGGACTATCAGATA 
GTTGATAATTCTCAGAGGGAAAATCAAGAAGGAGCAGCAAATGTCAACGTGAGAGGGGAGAAGGATGAGC 
AGACGAAGGAAGTAAAGGAGGCAAAGAAGAAAGATAAATGA 

Human SPG20 mRNA sequence - var6 (public gi: 22074831) 

GCGGCCGCGCAGGGAGCTCTCGAGGCAACGCCGGGGCGCCCGAGGTCTGGAAGGCGCAGAAATGGAGCAA 
GAGCCACAAAATGGAGAACCTGCTGAAATTAAGATCATCAGAGAAGCATATAAGAAGGCCTTTTTATTTG 
TTAACAAAGGTCTGAATACAGATGAATTAGGTCAGAAGGAAGAAGCAAAGAACTACTATAAGCAAGGAAT 
AGGACACCTGCTCAGAGGGATCAGCATTTCATCAAAAGAGTCTGAACACACAGGTCCTGGGTGGGAATCT 
GCTAGACAGATGCAACAGAAAATGAAAGAAACTCTACAGAATGTACGCACCAGGCTGGAAATTCTAGAGA 
AGGGTCTTGCCACTTCTCTGCAGAATGATCTTCAGGAGGTGCCCAAGTTATATCCAGAATTTCCACCTAA 
AGACATGTGTGAAAAATTACCAGAGCCTCAGTCTTTTAGTTCAGCTCCTCAGCATGCTGAAGTAAATGGA 
AACACCTCAACTCCAAGTGCAGGGGCAGTTGCTGCACCTGCTTCTCTGTCTTTACCATCACAAAGTTGTC 
CAGCAGAAGCTCCTCCTGCTTATACTCCTCAAGCTGCTGAAGGTCACTACACTGTATCCTATGGAACAGA 
TTCTGGGGAGTTTTCATCAGTTGGAGAGGAGTTTTATAGGAATCATTCTCAGCCACCGCCTCTTGAGACC 
TTAGGGCTGGATGCAGATGAATTGATTTTGATACCAAATGGAGTACAGATTTTTTTTGTAAATCCTGCAG 
GGGAGGTTAGTGCACCTTCGTATCCTGGGTACCTTCGAATTGTGAGGTTTTTGGATAATTCTCTCGATAC 
GGTTCTAAACCGTCCTCCCGGGTTTCTTCAGGTTTGTGACTGGTTATATCCTCTAGTTCCTGATAGATCT 
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CCGGTTCTGAAATGTACTGCGGGAGCCTACATGTTTCCTGATACAATGCTACAAGCAGCAGGATGCTTTG 
TGGGGGTCGTCCTGTCCTCTGAGTTACCAGAGGATGATAGAGAGCTCTTTGAGGATCTGTTAAGGCAAAT 
GTCTGACCTTCGGCTCCAGGCCAACTGGAACAGAGCAGAAGAAGAAAATGAATTCCAAATCCCTGGAAGA 
ACTAGACCCTCCTCTGACCAACTAAAAGAAGCCTCTGGCACTGATGTGAAACAGTTGGACCAAGGCAATA 
AGGATGTACGTCATAAAGGAAAACGTGGAAAAAGGGCTAAAGATACTTCAAGTGAAGAAGTTAACCTGAG 
TCACATTGTACCATGTGAGCCAGTTCCAGAAGAAAAGCCAAAAGAATTACCTGAATGGAGTGAAAAAGTG 
GCTCACAACATTTTGTCAGGTGCTTCCTGGGTGAGTTGGGGTTTAGTCAAAGGTGCTGAGATTACTGGTA 
AGGCAATCCAGAAAGGTGCTTCTAAACTCCGAGAGCGGATTCAACCAGAAGAAAAACCCGTGGAAGTTAG 
TCCAGCTGTCACCAAGGGACTTTATATAGCGAAGCAAGCTACAGGAGGAGCAGCAAAAGTCAGTCAGTTC 
CTGGTTGATGGAGTTTGCACTGTAGCAAATTGCGTTGGAAAAGAACTAGCTCCACATGTCAAGAAGCATG 
GAAGCAAACTTGTTCCAGAATCTCTTAAAAAAGACAAAGATGGGAAATCTCCTCTGGATGGTGCTATGGT 
TGTAGCAGCAAGTAGTGTTCAAGGATTTTCAACTGTCTGGCAAGGATTGGAATGTGCAGCTAAATGCATC 
GTTAACAATGTTTCAGCAGAAACTGTACAAACTGTCAGATACAAATACGGATATAATGCAGGAGAAGCTA 
CCCACCATGCGGTGGATTCTGCGGTCAATGTTGGCGTAACTGCCTACAATATTAACAACATTGGTATCAA 
AGCAATGGTGAAGAAAACTGCAACACAAACAGGACACACTCTCCTTGAGGACTATCAGATAGTTGATAAT 
TCTCAGAGGGAAAATCAAGAAGGAGCAGCAAATGTCAACGTGAGAGGGGAGAAGGATGAGCAGACGAAGG 
AAGTAAAGGAGGCAAAGAAGAAAGATAAATGATGAAGTGCTGGGAATCACTTATACCAAAGCCTTATGAA 
ATGGATGAAATTTTGTTAAATAGGCAAATGTGGAATTCCTCACAGATTAACCAGTATTTTTTAAATGTAT 
TCATTCCTACAAATTAACTTTCATAAATTTTATGGCATGTCTTCTATTTAAAAGGAAAAGAATAAGTATT 
CTTGCATCTGGCCTTAGAAATGTGAAGTTATATTCTCAAGTTTATTTTTTTCCAAGTGTAGCTAAAATAT 
TTTTGCAGGTAAAATAAAGCTGATAGTACATGTGTTGTTCAAACCTTGTTAAACCTAATATTGAACTATT 
TTTATATCTGCTGTCTTTCAGAAGGCAAATAGGAAACTATATATTTGCTTAAAAATTGGCATTTAGTAAC 
CTTAATTCTTTTTATAGAAGGAATGACTTAAAGTATTGTCCCCTCTTTTTGCACTAATTGTGGATTTTTT 
TAGATGCTTCTCAAAATTTTCAGTGTGTAAGCTAAACAAAAACTAAAACTAAGAATTCTCAAAAAAACTT 
GTTCAAAACAGGGAAAGACTGATGAAAAGTAAAATGGACTACTTTTGTAACTTACCTGTTTGTTAGGAAA 
TGGAATGGTCTCTTTGATTTAAAATAAATAAAAATAGATTATTACGTCTTTTGTATTGAGACTGTATTGT 
TATGAGCCTAGGAAATTTGGGAACATGATTGTATTGTATTAAAATTCGAAGTGATTATTATCAGCTTAAT 
TGGATTAAAAAAGTACTTCAAGAAATTATTTTATCATATCTGCTTCTGTTTTTCCAAAAGGTTAAAACTT 
GTAAAAAAAATATATATAAACAATTGAGTTTACTAATGGTAAACATTTTTATTCTGGGATTCGGTCATTG 
GAATTTATATTAAAAGACAAGTTATTAAAAAGGAAAGGTTCTATTCATAATCAGGGTAAAGAATATGAAA 
ACCTTAGACGTAATCCATGGTGGATAGGCATTATGGTTTCCACTTTGGCAGAAGGCAGACTATTCACAGC 
CCTATTTACTTACATAGGCTAAAAAACTATGTAACTAAATACCTAATGGTATTTAATTTTTGTTTATTGA 
ATTTAAGAGATTGGTATTAGTTTTCATAGCTGTAGTCCATTCTAATAATTTCTGATCTTCTAGTGGCTAC 
TTAATTAGACATTATTTGAAGCTGTCTGAAGAATGCACTTTATGAATTAAAAAACTGAATTGCCTGACCT 
CGTTATCACATGAGCTTATATTTTGGGAACACATAGAACTGATGGAGGCTTTTCCTAAGGCCAAGGATAA 
TGTACTAGTTGTTAAAATGGAAATAAAAGTGAAGTGGTAAAT 

Human SPG20 mRNA sequence - var7 (public gi: 20070 so 9) 

GGCGGCGGCGTGCTGCGGGCTCTGTGGCGGGAGCGAGGCCGACGGGCGGGGCCGTGCGGCCGCGTGACGC 
GAAGCGTTCGAGAGCGCGCGTCGTGGAACGTCTTGGTTGCCACGGCAAGCGCGCGCGCGAGGCCTTGGGA 
ACCTCGGGACCGGCCCCCGGCGAGCGCAGCGGCGCCCAGTAGTCATCTTAGTGGGATTTGGGGAAGCAAC 
AGGGCTGTGTGGGGTAACCTGCCACCTTTAAGTGGAAATCAGAAATGGAGCAAGAGCCACAAAATGGAGA 
ACCTGCTGAAATTAAGATCATCAGAGAAGCATATAAGAAGGCCTTTTTATTTGTTAACAAAGGTCTGAAT 
ACAGATGAATTAGGTCAGAAGGAAGAAGCAAAGAACTACTATAAGCAAGGAATAGGACACCTGCTCAGAG 
GGATCAGCATTTCATCAAAAGAGTCTGAACACACAGGTCCTGGGTGGGAATCTGCTAGACAGATGCAACA 
GAAAATGAAAGAAACTCTACAGAATGTACGCACCAGGCTGGAAATTCTAGAGAAGGGTCTTGCCACTTCT 
CTGCAGAATGATCTTCAGGAGGTGCCCAAGTTATATCCAGAATTTCCACCTAAAGACATGTGTGAAAAAT 
TACCAGAGCCTCAGTCTTTTAGTTCAGCTCCTCAGCATGCTGAAGTAAATGGAAACACCTCAACTCCAAG 
TGCAGGGGCAGTTGCTGCACCTGCTTCTCTGTCTTTACCATCACAAAGTTGTCCAGCAGAAGCTCCTCCT 
GCTTATACTCCTCAAGCTGCTGAAGGTCACTACACTGTATCCTATGGAACAGATTCTGGGGAGTTTTCAT 
CAGTTGGAGAGGAGTTTTATAGGAATCATTCTCAGCCACCGCCTCTTGAGACCTTAGGGCTGGATGCAGA 
TGAATTGATTTTGATACCAAATGGAGTACAGATTTTTTTTGTAAATCCTGCAGGGGAGGTTAGTGCACCT 
TCGTATCCTGGGTACCTTCGAATTGTGAGGTTTTTGGATAATTCTCTCGATACGGTTCTAAACCGTCCTC 
CCGGGTTTCTTCAGGTTTGTGACTGGTTATATCCTCTAGTTCCTGATAGATCTCCGGTTCTGAAATGTAC 
TGCGGGAGCCTACATGTTTCCTGATACAATGCTACAAGCAGCAGGATGCTTTGTGGGGGTCGTCCTGTCC 
TCTGAGTTACCAGAGGATGATAGAGAGCTCTTTGAGGATCTGTTAAGGCAAATGTCTGACCTTCGGCTCC 
AGGCCAACTGGAACAGAGCAGAAGAAGAAAATGAATTCCAAATCCCTGGAAGAACTAGACCCTCCTCTGA 
CCAACTAAAAGAAGCCTCTGGCACTGATGTGAAACAGTTGGACCAAGGCAATAAGGATGTACGTCATAAA 
GGAAAACGTGGAAAAAGGGCTAAAGATACTTCAAGTGAAGAAGTTAACCTGAGTCACATTGTACCATGTG 
AGCCAGTTCCAGAAGAAAAGCCAAAAGAATTACCTGAATGGAGTGAAAAAGTGGCTCACAACATTTTGTC 
AGGTGCTTCCTGGGTGAGTTGGGGTTTAGTCAAAGGTGCTGAGATTACTGGTAAGGCAATCCAGAAAGGT 
GCTTCTAAACTCCGAGAGCGGATTCAACCAGAAGAAAAACCCGTGGAAGTTAGTCCAGCTGTCACCAAGG 
GACTTTATATAGCGAAGCAAGCTACAGGAGGAGCAGCAAAAGTCAGTCAGTTCCTGGTTGATGGAGTTTG 
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CACTGTAGC7^AATTGCGTTGGAAAAGAACTAGCTCCACATGTCAAGAAGCATGGAAGTCAAACTTGTTCC 
AGAATCTCTTAAAAAAGACAAAGATGGGAAATCTCCTCTGGATGGTGCTATGGTTGTAGCAGCAAGTAGT 
GTTCAAGGATTTTCAACTGTCTGGCAAGGATTGGAATGTGCAGCTAAATGCATCGTTAACAATGTTTCAG 
CAGAAACTGTACAAACTGTCAGATACAAATACGGATATAATGCAGGAGAAGCTACCCACCATGCGGTGGA 
TTCTGCGGTCAATGTTGGCGTAACTGCCTACAATATTAACAACATTGGTATCAAAGCAATGGTGAAGAAA 
ACTGCAACACAAACAGGACACACTCTCCTTGAGGACTATCAGATAGTTGATAATTCTCAGAGGGAAAATC 
AAGAAGGAGCAGCAAATGTCAACGTGAGAGGGGAGAAGGATGAGCAGACGAAGGAAGTAAAGGAGGCAAA 
GAAGAAAGATAAATGATGAAGTGCTGGGAATCACTTATACCAAAGCCTTATGAAATGGATGAAATTTTGT 
TAAATAGGCAAATGTGGAATTCCTCACAGATTAACCAGTATTTTTTT^AATGTATTCATTCCTACAAATTA 
ACTTTCATAAATTTTATGGCATGTCTTCTATTTAAAAGGAAAAGAATAAGTATTCTTGCATCTGGCCTTA 
GAAATGTGAAGTTATATTCTCAAGTTTATTTTTTTCCAAGTGTAGCTAAAATATTTTTGCAGGTAAAATA 
AAGCTGATAGTACATGTGTTGTTCAAACCTTGTTAAACCTAATATTGAACTATTTTTATATCTGCTGTCT 
TTCAGAAGGCAAATAGGAAACTATATATTTGCTTAAAAATTGGCATTTAGTAACCTTAATTCTTTTTATA 
GAAGGAATGACTTAAAGTATTGTCCCCTCTTTTTGCACTAATTGTGGATTTTTTTAGATGCTTCTCAAAA 
TTTTCAGTGTGTAAGCTAAACAAAAACTAAAACTAAGAATTCTCAAAAAAACTTGTTCAAAACAGGGAAA 
GACTGATGAAAAGTAAAATGGACTACTTTTGTAACTTACCTGTTTGTTAGGAAATGGAATGGTCTCTTTG 
ATTTAAAATGAATAAAAATAGATTATTACGTCTTTTGTATTGAGACTGTATTGTTATGAGCCTAGGAAAT 
TTGGGAACATGATTGTATTGTATTAAAATTCGAAGTGATTATTATCAGCTTAATTGGATTAAAAAAGTAC 
TTCAAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 

Human SPG20 mRNA sequence - var8 (public gi: 3043743) 

GCGGCCGCGCAGGGAGCTCTCGAGGCAACGCCGGGGCGCCCGAGGTCTGGAAGGCGCAGAAATGGAGCAA 
GAGCCACAAAATGGAGAACCTGCTGAAATTAAGATCATCAGAGAAGCATATAAGAAGGCCTTTTTATTTG 
TTAACAAAGGTCTGAATACAGATGAATTAGGTCAGAAGGAAGAAGCAAAGAACTACTATAAGCAAGGAAT 
AGGACACCTGCTCAGAGGGATCAGCATTTCATCAAAAGAGTCTGAACACACAGGTCCTGGGTGGGAATCT 
GCTAGACAGATGCAACAGAAAATGAAAGAAACTCTACAGAATGTACGCACCAGGCTGGAAATTCTAGAGA 
AGGGTCTTGCCACTTCTCTGCAGAATGATCTTCAGGAGGTGCCCAAGTTATATCCAGAATTTCCACCTAA 
AGACATGTGTGAAAAATTACCAGAGCCTCAGTCTTTTAGTTCAGCTCCTCAGCATGCTGAAGTAAATGGA 
AACACCTCAACTCCAAGTGCAGGGGCAGTTGCTGCACCTGCTTCTCTGTCTTTACCATCACAAAGTTGTC 
CAGCAGAAGCTCCTCCTGCTTATACTCCTCAAGCTGCTGAAGGTCACTACACTGTATCCTATGGAACAGA 
TTCTGGGGAGTTTTCATCAGTTGGAGAGGAGTTTTATAGGAATCATTCTCAGCCACCGCCTCTTGAGACC 
TTAGGGCTGGATGCAGATGAATTGATTTTGATACCAAATGGAGTACAGATTTTTTTTGTAAATCCTGCAG 
GGGAGGTTAGTGCACCTTCGTATCCTGGGTACCTTCGAATTGTGAGGTTTTTGGATAATTCTCTCGATAC 
GGTTCTAAACCGTCCTCCCGGGTTTCTTCAGGTTTGTGACTGGTTATATCCTCTAGTTCCTGATAGATCT 
CCGGTTCTGAAATGTACTGCGGGAGCCTACATGTTTCCTGATACAATGCTACAAGCAGCAGGATGCTTTG 
TGGGGGTCGTCCTGTCCTCTGAGTTACCAGAGGATGATAGAGAGCTCTTTGAGGATCTGTTAAGGCAAAT 
GTCTGACCTTCGGCTCCAGGCCAACTGGAACAGAGCAGAAGAAGAAAATGAATTCCAAATCCCTGGAAGA 
ACTAGACCCTCCTCTGACCAACTAAAAGAAGCCTCTGGCACTGATGTGAAACAGTTGGACCAAGGCAATA 
AGGATGTACGTCATAAAGGAAAACGTGGAAAAAGGGCTAAAGATACTTCAAGTGAAGAAGTTAACCTGAG 
TCACATTGTACCATGTGAGCCAGTTCCAGAAGAAAAGCCAAAAGAATTACCTGAATGGAGTGAAAAAGTG 
GCTCACAACATTTTGTCAGGTGCTTCCTGGGTGAGTTGGGGTTTAGTCAAAGGTGCTGAGATTACTGGTA 
AGGCAATCCAGAAAGGTGCTTCTAAACTCCGAGAGCGGATTCAACCAGAAGAAAAACCCGTGGAAGTTAG 
TCCAGCTGTCACCAAGGGACTTTATATAGCGAAGCAAGCTACAGGAGGAGCAGCAAAAGTCAGTCAGTTC 
CTGGTTGATGGAGTTTGCACTGTAGCAAATTGCGTTGGAAAAGAACTAGCTCCACATGTCAAGAAGCATG 
GAAGCAAACTTGTTCCAGAATCTCTTAAAAAAGACAAAGATGGGAAATCTCCTCTGGATGGTGCTATGGT 
TGTAGCAGCAAGTAGTGTTCAAGGATTTTCAACTGTCTGGCAAGGATTGGAATGTGCAGCTAAATGCATC 
GTTAACAATGTTTCAGCAGAAACTGTACAAACTGTCAGATACAAATACGGATATAATGCAGGAGAAGCTA 
CCCACCATGCGGTGGATTCTGCGGTCAATGTTGGCGTAACTGCCTACAATATTAACAACATTGGTATCAA 
AGCAATGGTGAAGAAAACTGCAACACAAACAGGACACACTCTCCTTGAGGACTATCAGATAGTTGATAAT 
TCTCAGAGGGAAAATCAAGAAGGAGCAGCAAATGTCAACGTGAGAGGGGAGAAGGATGAGCAGACGAAGG 
AAGTAAAGGAGGCAAAGAAGAAAGATAAATGATGAAGTGCTGGGAATCACTTATACCAAAGCCTTATGAA 
ATGGATGAAATTTTGTTAAATAGGCAAATGTGGAATTCCTCACAGATTAACCAGTATTTTTTAAATGTAT 
TCATTCCTACAAATTAACTTTCATAAATTTTATGGCATGTCTTCTATTTAAAAGGAAAAGAATAAGTATT 
CTTGCATCTGGCCTTAGAAATGTGAAGTTATATTCTCAAGTTTATTTTTTTCCAAGTGTAGCTAAAATAT 
TTTTGCAGGTAAAATAAAGCTGATAGTACATGTGTTGTTCAAACCTTGTTAAACCTAATATTGAACTATT 
TTTATATCTGCTGTCTTTCAGAAGGCAAATAGGAAACTATATATTTGCTTAAAAATTGGCATTTAGTAAC 
CTTAATTCTTTTTATAGAAGGAATGACTTAAAGTATTGTCCCCTCTTTTTGCACTAATTGTGGATTTTTT 
TAGATGCTTCTCAAAATTTTCAGTGTGTAAGCTAAACAAAAACTAAAACTAAGAATTCTCAAAAAAACTT 
GTTCAAAACAGGGAAAGACTGATGAAAAGTAAAATGGACTACTTTTGTAACTTACCTGTTTGTTAGGAAA 
TGGAATGGTCTCTTTGATTTAAAATGAATAAAAATAGATTATTACGTCTTTTGTATTGAGACTGTATTGT 
TATGAGCCTAGGAAATTTGGGAACATGATTGTATTGTATTAAAATTCGAAGTGATTATTATCAGCTTAAT 
TGGATTAAAAAAGTACTTCAAGAAATTATTTTATCATATCTGCTTCTGTTTTTCCAAAAGGTTAAAACTT 
GTAAAAAAAATATATATAAACAATTGAGTTTACTAATGGTAAACATTTTTATTCTGGGATTCGGTCATTG 



Figure 36 part - 147 



GAATTTATATTAAAAGACAAGTTATTAAAAAGGAAAGGTTCTATTCATAATCAGGGTAAAGAATATGAAA 
ACCTTAGACGTAATCCATGGTGGATAGGCATTATGGTTTCCACTTTGGCAGAAGGCAGACTATTCACAGC 
CCTATTTACTTACATAGGCTAAAAAACTATGTAACTAAATACCTAATGGTATTTAATTTTTGTTTATTGA 
ATTTAAGAGATTGGTATTAGTTTTCATAGCTGTAGTCCATTCTAATAATTTCTGATCTTCTAGTGGCTAC 
TTAATTAGACATTATTTGAAGCTGTCTGAAGAATGCACTTTATGAATTAAAAAACTGAATTGCCTGACCT 
CGTTATCACATGAGCTTATATTTTGGGAACACATAGAACTGATGGAGGCTTTTCCTAAGGCCAAGGATAA 
TGTACTAGTTGTTAAAATGGAAATAAAAGTGAAGTGGTAAAT 

Human SPG20 protein sequence - varl (public gi: 28436885) 

MEQEPQNGEPAEIKIIREAYKKAFLFVNKGLNTDELGQKEEAKNYYKQGIGHLLRGISISSKESEHTGTG 

WESARQMQQKMKETLQNVRTRLEILEKGLATSLQNDLQEVPKLYPEFPPKDMCEKiPEPQSFSSAPQHM 

VNGNTSTPSAGAVAAPASLSLPSQSCPAEAPPAYTPQAAEGHYTVSYGTDSGEFSSVGEEFYRNHSQPPP 

LETLGLDADELILIPNGVQIFFVNPAGEVSAPSYPGYLRIVRFLDNSLDTVLNRPPGFLQVCDWLYPLVP 

DRSPVLKCTAGAYMFPDTMLQAAGCFVGWLSSELPEDDRELFEDLLRQMSDLRLQANWNRAEEENEFQI 

PGRTRPSSDQLKEASGTDVKQLDQGNKDVRHKGKRGKRAKDTSSEEVNLSHIVPCEPVPEEKPKELHEWS 

EKVAHNILSGASWVSWGLVKGAEITGKAIQKGASKLRERIQPEEKPVEVSPAVTKGLYIAKQATGGAAKV 

SQFLVDGVCTVANC^GKELAPHVKKHGSKLVPESLKKDKDGKSPLDGAMWAASSVQGFSTWQGLECAA 

KCIVNNVSAETVQTVRYKYGYNAGEATHHAVDSAVOTGVTAYNI 

VDNSQRENQEGAANVNVRGEKDEQTKEVKEAKKKDK 

Human SPG20 protein sequence - var2 (public gi: 22074832) 

MEQEPQNGEPAEIKIIREAYKKAFLFVNKGLNTDELGQKEEAKNYYKQGIGHLLRGISISSKESEHTGPG 
WESARQMQQKMKETLQbTVRTRLEILEKGLATSLQNDLQEVPKLYPEFPPKDMCEKLPEPQSFSSAPQHAE 
VNGNTSTPSAGAVAAPASLSLPSQSCPAEAPPAYTPQAAEGHYTVSYGTDSGEFSSVGEEFYRNHSQPPP 
LETLGLDADELI LI PNGVQI FFVNPAGEVSAPS YPGYLRI VRFLDNSLDTVLNRPPGFLQVCDWLYPLVP 
DRSPVLKCTAGAYMFPDTMLQAAGCFVGWLSSELPEDDRELFEDLLRQMSDLRLQANWNRAEEENEFQI 
PGRTRPSSDQLKEASGTDVKQLDQGNKDVRHKGKRGKRAKDTSSEEVNLSHIVPCEPVPEEKPKELPEWS 
EKVAHNILSGASWVSWGLVKGAEITGKAIQKGASKLRERIQPEEKPVEVSPAVTKGLYIAKQATGGAAKV 
SQFLVDGVCTVANCVGKELAPHVKKHGSKLVPESLKKDKDGK^ 

KC I VNNVS AETVQTVRYKYG YNAGEATHHAVDS AVNVGVTAYN I NN I G I KAMVKKTATQTGHTLLED YQ I 
VDNSQRENQEGAANVNVRGEKDEQTKEVKEAKKKDK 

Human SPG20 protein sequence - var3 (public gi: 3043744) 

RPRRELSRQRRGARGLEGAEMEQE PQNGE P AE I KI IREAYKKAFLFWKGLNTDELGQKEEAKNYYKQGI 

GHLLRGISISSKESEHTGPGWESARQMQQKMKETLQNVRTRLEILEKGLATSLQNDLQEVPKLYPEFPPK 

DMCEKLPEPQSFSSAPQHAEVNGNTSTPSAGAVAAPASLSLPSQSCPAEAPPAYTPQAAEGHYTVSYGTD 

SGEFSSVGEEFYRNHSQPPPLETLGLDADELILI PNGVQI FFVNPAGEVSAPS YPGYLRI VRFLDNSLDT 

VLNRPPGFLQVCDWLYPLVPDRSPVLKCTAGAYMFPDTMLQAAGCFVGWLSSELPEDDRELFEDLLRQM 

SDLRLQANWNRAEEENEFQIPGRTRPSSDQLKEASGTDVKQLDQGNKDVRHKGKRGKRAKDTSSEEVNLS 

HIVPCEPVPEEKPKELPEWSEKVAHNILSGASWVSWGLVKGAEITGKAIQKGASKLRERIQPEEKPVEVS 

PAVTKGLYIAKQATGGAAKVSQFLVDGVCTVANCVGKELAPHVKKHGSKLVPESLKKDKDGKSPLDGAMV 

VAASSVQGFSTVWQGLECAAKC I VNNVS AEWQWRYKYG YNAGEATHHAVDS AVNVGVTAYN I N^ 

AMVKKTATQTGHTLLEDYQIVDNSQRENQEGAANVNVRGEKDEQTKEVKEAKKKDK 

Unigene Name; WASF1 Unigene ID: Hs - 758 5 0 

Human WASF1 mRNA sequence - varl (public gi: 4507912) 

CTTCTCTTGCACTTGCGGATGATGAACTGGAATAACGATGAAAGAAAGCACATCCGATCTCAACATTCAC 
GTCCTGCCCTATAACCGATTAATTAATTGATCCCCAGCTAGACTAGTGTTGGAGAAATCAGCATGTTAAA 
ACAACTGTTGATGATAGCTGTTGGAGTAAAGTTGCAGTGGAAGCTATGGCTGCAAAATCGTTAAAATCTT 
CAAGGTGAACTGGCACAAAGGTTAATCTCAAGATGCCGCTAGTGAAAAGAAACATCGATCCTAGGCACTT 
GTGCCACACAGCACTGCCTAGAGGCATTAAGAATGAACTGGAATGTGTAACCAATATTTCCTTGGCAAAT 
ATAATTAGACAACTAAGTAGCCTAAGTAAATATGCTGAAGATATATTTGGAGAATTATTCAATGAAGCAC 
ATAGTTTTTCCTTCAGAGTCAACTCATTGCAAGAACGTGTGGACCGTTTATCTGTTAGTGTTACACAGCT 
TGATCCAAAGGAAGAAGAATTGTCTTTGCAAGATATAACAATGAGGAAAGCTTTCCGAAGTTCTACAATT 
CAAGACCAGCAGCTTTTCGATCGCAAGACTTTGCCTATTCCATTACAGGAGACGTACGATGTTTGTGAAC 
AGCCTCCACCTCTCAATATACTCACTCCTTATAGAGATGATGGTAAAGAAGGTCTGAAGTTTTATACCAA 
TCCTTCGTATTTCTTTGATCTATGGAAAGAAAAAATGTTGCAAGATACAGAGGATAAGAGGAAGGAAAAG 
AGGAAGCAGAAGCAGAAAAATCTAGATCGTCCTCATGAACCAGAAAAAGTGCCAAGAGCACCTCATGACA 
GGCGGCGAGAATGGCAGAAGCTGGCCCAAGGTCCAGAGCTGGCTGAAGATGATGCTAATCTCTTACATAA 
GCATATTGAAGTTGCTAATGGCCCAGCCTCTCATTTTGAAACAAGACCTCAGACATACGTGGATCATATG 
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GATGGATCTTACTCACTTTCTGCCTTGCCATTTAGTCAGATGAGTGAGCTTCTGACTAGAGCTGAGGAAA 
GGGTATTAGTCAGACCACATGAACCACCTCCACCTCCACCAATGCATGGAGCAGGAGATGCAAAACCGAT 
ACCCACCTGTATCAGTTCTGCTACAGGTTTGATAGAAAATCGCCCTCAGTCACCAGCTACAGGCAGAACA 
CCTGTGTTTGTGAGCCCCACTCCCCCACCTCCTCCACCACCTCTTCCATCTGCCTTGTCAACTTCCTCAT 
TAAGAGCTTCAATGACTTCAACTCCTCCCCCTCCAGTACCTCCCCCACCTCCACCTCCAGCCACTGCTTT 
GCAAGCTCCAGCAGTACCACCACCTCCAGCTCCTCTTCAGATTGCCCCTGGAGTTCTTCACCCAGCTCCT 
CCTCCAATTGCACCTCCTCTAGTACAGCCCTCTCCACCAGTAGCTAGAGCTGCCCCAGTATGTGAGACTG 
TACCAGTTCATCCACTCCCACAAGGTGAAGTTCAGGGGCTGCCTCCACCCCCACCACCGCCTCCTCTGCC 
TCCACCTGGCATTCGACCATCATCACCTGTCACAGTTACAGCTCTTGCTCATCCTCCCTCTGGGCTACAT 
CCAACTCCATCTACTGCCCCAGGTCCCCATGTTCCATTAATGCCTCCATCTCCTCCATCACAAGTTATAC 
CTGCTTCTGAGCCAAAGCGCCATCCATCAACCCTACCTGTAATCAGTGATGCCAGGAGTGTGCTACTGGA 
AGCAATACGAAAAGGTATTCAGCTACGCAAAGTAGAAGAGCAGCGTGAACAGGAAGCTAAGCATGAACGC 
ATTGAAAACGATGTTGCCACCATCCTGTCTCGCCGTATTGCTGTTGAATATAGTGATTCGGAAGATGATT 
CAGAATTTGATGAAGTAGATTGGTTGGAGTAAGAAAAATGCATTGATAAATATTACAAAACTGAATGCAA 
ATGTCCTTTGTGGTGCTTGTTCCTTGAAAATGTTTGGTCATTCTAGTGTTTTGCTTTCTTTTCCTTATAA 
TAAATGACCCTTTTCCTCCATAACTTTTGATTTCTAAGGAAAATATTAGCATACATTTCAAACTAAATGT 
TTTACAGTGGCTTATCTTTTTTTTCCCCCTGAAAAGACTAATTTGGTCAAATAAACCACTAAGTATTAAG 
CATGGACAGCTGTTGTTAGAGTAGCAGATTCAGTTTTTTGATATATCTTAATTGTGTACTTTGTGAATTT 
TAATTTAAAGAAAGCAACTGAAATTGAAATCTTGAGGGCAGCTGTATCTACTAATGAGCCTTATTCCATT 
TCCTGATGTTTTAAAAGAAGAAACACTGCCTTGATTATACG/^ATACACTCAGAAAGTACATTTAGCTTGT 
AGTGTTGAATTCTCTTAAAGGAATGCTTGAATTTTTTCATTATTGTTTTATTGTTTTTATATACTTGCCT 
TATTTGAATGTTTAGCAGTATCCCCTTCCCACTTATATATTGTGTGATATGATTTTGCTTGCCTATAGGA 
GTTAAAAACTTTTCCATGTGAAATACTCTGACTTAAACATACATGTAACTTACATAACTGTTAAGAATAA 
CAGTCTGATTTAATAAATGGTTCATTTTAAAAGTT 

Human VVASF1 mRNA sequence - var2 (public gi: 4927209) 

ATGCCGCTAGTGAAAAGAAACATCGATCCTAGGCACTTGTGCCACACAGCACTGCCTAGAGGCATTAAGA 
ATGAACTGGAATGTGTAACCAATATTTCCTTGGCAAATATAATTAGACAACTAAGTAGCCTAAGTAAATA 
TGCTGAAGATATATTTGGAGAATTATTCAATGAAGCACATAGTTTTTCCTTCAGAGTCAACTCATTGCAA 
GAACGTGTGGACCGTTTATCTGTTAGTGTTACACAGCTTGATCCAAAGGAAGAAGAATTGTCTTTGCAAG 
ATATAACAATGAGGAAAGCTTTCCGAAGTTCTACAATTCAAGACCAGCAGCTTTTCGATCGCAAGACTTT 
GCCTATTCCATTACAGGAGACGTACGATGTTTGTGAACAGCCTCCACCTCTCAATATACTCACTCCTTAT 
AGAGATGATGGTAAAGAAGGTCTGAAGTTTTATACCAATCCTTCGTATTTCTTTGATCTATGGAAAGAAA 
AAATGTTGCAAGATACAGAGGATAAGAGGAAGGAAAAGAGGAAGCAGAAGCAGAAAAATCTAGATCGTCC 
TCATGAACCAGAAAAAGTGCCAAGAGCACCTCATGACAGGCGGCGAGAATGGCAGAAGCTGGCCCAAGGT 
CCAGAGCTGGCTGAAGATGATGCTAATCTCTTACATAAGCATATTGAAGTTGCTAATGGCCCAGCCTCTC 
ATTTTGAAACAAGACCTCAGACATACGTGGATCATATGGATGGATCTTACTCACTTTCTGCCTTGCCATT 
TAGTCAGATGAGTGAGCTTCTGACTAGAGCTGAGGAAAGGGTATTAGTCAGACCACATGAACCACCTCCA 
CCTCCACCAATGCATGGAGCAGGAGATGCAAAACCGATACCCACCTGTATCAGTTCTGCTACAGGTTTGA 
TAGAAAATCGCCCTCAGTCACCAGCTACAGGCAGAACACCTGTGTTTGTGAGCCCCACTCCCCCACCTCC 
TCCACCACCTCTTCCATCTGCCTTGTCAACTTCCTCATTAAGAGCTTCAATGACTTCAACTCCTCCCCCT 
CCAGTACCTCCCCCACCTCCACCTCCAGCCACTGCTTTGCAAGCTCCAGCAGTACCACCACCTCCAGCTC 
CTCTTCAGATTGCCCCTGGAGTTCTTCACCCAGCTCCTCCTCCAATTGCACCTCCTCTAGTACAGCCCTC 
TCCACCAGTAGCTAGAGCTGCCCCAGTATGTGAGACTGTACCAGTTCATCCACTCCCACAAGGTGAAGTT 
CAGGGGCTGCCTCCACCCCCACCACCGCCTCCTCTGCCTCCACCTGGCATTCGACCATCATCACCTGTCA 
CAGTTACAGCTCTTGCTCATCCTCCCTCTGGGCTACATCCAACTCCATCTACTGCCCCAGGTCCCCATGT 
TCCATTAATGCCTCCATCTCCTCCATCACAAGTTATACCTGCTTCTGAGCCAAAGCGCCATCCATCAACC 
CTACCTGTAATCAGTGATGCCAGGAGTGTGCTACTGGAAGCAATACGAAAAGGTATTCAGCTACGCAAAG 
TAGAAGAGCAGCGTGAACAGGAAGCTAAGCATGAACGCATTGAAAACGATGTTGCCACCATCCTGTCTCG 
CCGTATTGCTGTTGAATATAGTGATTCGGAAGATGATTCAGAATTTGATGAAGTAGATTGGTTGGAGTAA 
GAAAAATGCATTGATAAATATTACAAAACTGAATGCAAATGTCCTTTGTGGTGCTTGTTCCTTGAAAATG 
TTTGGTCA 

Human WASF1 protein sequence - varl (public gi: 4507913) 

MPLVKRNIDPRHLCHTALPRGI KNELECVTNI SLANI IRQLSSLSKYAEDI FGELFNEAHSFSFRVNSLQ 
ERVDRLSVSVTQLDPKEEELSLQDITMRKAFRSSTIQDQQLFDRKTLPIPLQETYDVCEQPPPLNILTPY 
RDDGKEGLKFYTNPSYFFDLWKEKMLQDTEDKRKEKRKQKQ 

PELAEDDANLLHKHIEVANGPASHFETRPQTYVDHMDGSYSLSALPFSQMSELLTRAEERVLVRPHEPPP 
PPPMHGAGDAKPIPTCISSATGLIENRPQSPATGRTPVFVSPTPPPPPPPLPSALSTSSLRASMTSTPPP 
PVPPPPPPPATALQAPAVPPPPAPLQIAPGVLHPAPPPIAPPLVQPSPPVARAAPVCETVPVHPLPQGEV 
QGLPPPPPPPPLPPPGIRPSSPVTVTALAHPPSGLHPTPSTAPGPHVPLMPPSPPSQVIPASEPKRHPST 
LPVISDARSVLLEAIRKGIQLRKVEEQREQEAKHERIENDVATILSRRIAVEYSDSEDDSEFDEVDWLE 
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Unigene Name; HIP-55 Unigene ID; Hs. 183373 



Hitman HIP-55 mRNA sequence - varl (public gi: 6470260) 

ATGGCGGCGAACCTGAGCCGGAACGGGCCAGCGCTGCAAGAGGCCTACGTGCGGGTGGTCACCGAGAAGT 
CCCCGACCGACTGGGCTCTCTTTACCTATGAAGGCAACAGCAATGACATCCGCGTGGCTGGCACAGGGGA 
GGGTGGCCTGGAGGAGATGGTGGAGGAGCTCAACAGCGGGAAGGTGATGTACGCCTTCTGCAGAGTGAAG 
GACCCCAACTCTGGACTGCCCAAATTTGTCCTCATCAACTGGACAGGCGAGGGCGTGAACGATGTGCGGA 
AGGGAGCCTGTGCCAGCCACGTCAGCACCATGGCCAGCTTCCTGAAGGGGGCCCATGTGACCATCAACGC 
ACGGGCCGAGGAGGATGTGGAGCCTGAGTGCATCATGGAGAAGGTGGCCAAGGCTTCAGGTGCCAACTAC 
AGCTTTCACAAGGAGAGTGGCCGCTTCCAGGACGTGGGACCCCAGGCCCCAGTGGGCTCTGTGTACCAGA 
AGACCAATGCCGTGTCTGAGATTAAAAGGGTTGGTAAAGACAGCTTCTGGGCCAAAGCAGAGAAGGAGGA 
GGAGAACCGTCGGCTGGAGGAAAAGCGGCGGGCCGAGGAGGCACAGCGGCAGCTGGAGCAGGAGCGCCGG 
GAGCGTGAGCTGCGTGAGGCTGCACGCCGGGAGCAGCGCTATCAGGAGCAGGGTGGCGAGGCCAGCCCCC 
AGAGGACGTGGGAGCAGCAGCAAGAAGTGGTTTCAAGGAACCGAAATGAGCAGGAGTCTGCCGTGCACCC 
GAGGGAGATTTTCAAGCAGAAGGAGAGGGCCATGTCCACCACCTCCATCTCCAGTCCTCAGCCTGGCAAG 
CTGAGGAGCCCCTTCCTGCAGAAGCAGCTCACCCAACCAGAGACCCACTTTGGCAGAGAGCCAGCTGCTG 
CCATCTCAAGGCCCAGGGCAGATCTCCCTGCTGAGGAGCCGGCGCCCAGCACTCCTCCATGTCTGGTGCA 
GGCAGAAGAGGAGGCTGTGTATGAGGAACCTCCAGAGCAGGAGACCTTCTACGAGCAGCCCCCACTGGTG 
CAGCAGCAAGGTGCCGGCTCTGAGCACATTGACCACCACATTCAGGGCCAGGGGCTCAGTGGGCAAGGGC 
TCTGTGCCCGTGCCCTGTACGACTACCAGGCAGCCGACGACACAGAGATCTCCTTTGACCCCGAGAACCT 
CATCACGGGCATCGAGGTGATCGACGAAGGCTGGTGGCGTGGCTATGGGCCGGATGGCCATTTTGGCATG 
TTCCCTGCCAACTACGTGGAGCTCATTGAGTGAGGCTGAGGGCGGCCGCTAGACTAGTCTAGAGAAAAAA 
C 

Human HIP-55 mRNA sequence - var2 (public gi: 8885629). 

GAAGCTACAGCAGCGGCGCGGAGACTGCGGGGCGGGCCATGGCGGCGAACCTGAGCCGGAACGGGCCAGC 
GCTGCAAGAGGCCTACGTGCGGGTGGTCACCGAGAAGTCCCCGACCGACTGGGCTCTCTTTACCTATGAA 
GGCAACAGCAATGACATCCGCGTGGCTGGCACAGGGGAGGGTGGCCTGGAGGAGATGGTGGAGGAGCTCA 
ACAGCGGGAAGGTGATGTACGCCTTCTGCAGAGTGAAGGACCCCAACTCTGGACTGCCCAAATTTGTCCT 
CATCAACTGGACAGGCGAGGGCGTGAACGATGTGCGGAAGGGAGCCTGTGCCAGCCACGTCAGCACCATG 
GCCAGCTTCCTGAAGGGGGCCCATGTGACCATCAACGCACGGGCCGAGGAGGATGTGGAGCCTGAGTGCA 
TCATGGAGAAGGTGGCCAAGGCTTCAGGTGCCAACTACAGCTTTCACAAGGAGAGTGGCCGCTTCCAGGA 
CGTGGGACCCCAGGCCCCAGTGGGCTCTGTGTACCAGAAGACCAATGCCGTGTCTGAGATTAAAAGGGTT 
GGTAAAGACAGCTTCTGGGCCAAAGCAGAGAAGGAGGAGGAGAACCGTCGGCTGGAGGAAAAGCGGCGGG 
CCGAGGAGGCACAGCGGCAGCTGGAGCAGGAGCGCCGGGAGCGTGAGCTGCGTGAGGCTGCACGCCGGGA 
GCAGCGCTATCAGGAGCAGGGTGGCGAGGCCAGCCCCCAGAGGACGTGGGAGCAGCAGCAAGAAGTGGTT 
TCAAGGAACCGAAATGAGCAGGAGTCTGCCGTGCACCCGAGGGAGATTTTCAAGCAGAAGGAGAGGGCCA 
TGTCCACCACCTCCATCTCCAGTCCTCAGCCTGGCAAGCTGAGGAGCCCCTTCCTGCAGAAGCAGCTCAC 
CCAACCAGAGACCCACTTTGGCAGAGAGCCAGCTGCTGCCATCTCAAGGCCCAGGGCAGATCTCCCTGCT 
GAGGAGCCGGCGCCCAGCACTCCTCCATGTCTGGTGCAGGCAGAAGAGGAGGCTGTGTATGAGGAACCTC 
CAGAGCAGGAGACCTTCTACGAGCAGCCCCCACTGGTGCAGCAGCAAGGTGCTGGCTCTGAGCACATTGA 
CCACCACATTCAGGGCCAGGGGCTCAGTGGGCAAGGGCTCTGTGCCCGTGCCCTGTACGACTACCAGGCA 
GCCGACGACACAGAGATCTCCTTTGACCCCGAGAACCTCATCACGGGCATCGAGGTGATCGACGAAGGCT 
GGTGGCGTGGCTATGGGCCGGATGGCCATTTTGGCATGTTCCCTGCCAACTACGTGGAGCTCATTGAGTG 
AGGCTGAGGGCACATCTTGCCCTTCCCCTCTCAGACATGGCTTCCTTATTGCTGGAAGAGGAGGCCTGGG 
AGTTGACATTCAGCACTCTTCCAGGAATAGGACCCCCAGTGAGGATGAGGCCTCAGGGCTCCCTCCGGCT 
TGGCAGACTCAGCCTGTCACCCCAAATGCAGCAATGGCCTGGTGATTCCCACACATCCTTCCTGCATCCC 
CCGACCCTCCCAGACAGCTTGGCTCTTGCCCCTGACAGGATACTGAGCCAAGCCCTGCCTGTGGCCAAGC 
CCTGAGTGGCCACTGCCAAGCTGCGGGGAAGGGTCCTGAGCAGGGGCATCTGGGAGGCTCTGGCTGCCTT 
CTGCATTTATTTGCCTTTTTTCTTTTTCTCTTGCTTCTAAGGGGTGGTGGCCACCACTGTTTAGAATGAC 
CCTTGGGAACAGTGAACGTAGAGAATTGTTTTTAGCAGAGTTTGTGACCAAAGTCAGAGTGGATCATGGT 
GGTTTGGCAGCAGGGAATTTGTCTTGTTGGAGCCTGCTCTGTGCTCCCCACTCCATTTCTCTGTCCCTCT 
GCCTGGGCTATGGGAAGTGGGGATGCAGATGGCCAAGCTCCCACCCTGGGTATTCAAAAACGGCAGACAC 
AACATGTTCCTCCACGCGGCTCAAAAAAAAAAAAAAAAAAA 

Human HIP-55 mRNA sequence - var3 (public gi: 8917572) 

ATGGCGGCGAACCTGAGCCGGAACGGGCCAGCGCTGCAAGAGGCCTACGTGCGGGTGGTCACCGAGAAGT 
CCCCGACCGACTGGGCTCTCTTTACCTATGAAGGCAACAGCAATGACATCCGCGTGGCTGGCACAGGGGA 
GGGTGGCCTGGAGGAGATGGTGGAGGAGCTCAACAGCGGGAAGGTGATGTACGCCTTCTGCAGAGTGAAG 
GACCCCAACTCTGGACTGCCCAAATTTGTTCTCATCAACTGGACAGGCGAGGGCGTGAACGATGTGCGGA 
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AGGGAGCCTGTTCCAGCCACGTCAGCACCATGGCCAGCTTCCTGAAGGGGGCCCATGTGACCATCAACGC 
ACGGGCCGAGGAGGATGTGGAGCCTGAGTGCATCATGGAGAAGGTGGCCAAGGCTTCAGGTGCCAACTAC 
AGCTTTCACAAGGAGAGTGGCCGCTTCCAGGACGTGGGACCCCAGGCCCCAGTGGGCTCTGTGTACCAGA 
AGACCAATGCCGTGTCTGAGATTAAAAGGGTTGGTAAAGACAGCTTCTGGGCCAAAGCAGAGAAGGAGGA 
GGAGAACCGTCGGCTGGAGGAAAAGCGGCGGGCCGAGGAGGCACAGCGGCAGCTGGAGCAGGAGCGCCGG 
GAGCGTGAGCTGCGTGAGGCTGCACGCCGGGAGCAGCGCTATCAGGAGCAGGGTGGCGAGGCCAGCCCCC 
AGAGTACGTGGGAGCAGCAGCAAGAAGTGGTTTCAAGGAACCGAAATGAGCAGGAGTCTGCCGTGCACCC 
GAGGGAGATTTTCAAGCAGAAGGAGAGGGCCATGTCCACCACCTCCATCTCCAGTCCTCAGCCTGGCAAG 
CTGAGGAGCCCCTTCCTGCAGAAGCAGCTCACCCAACCAGAGACCCACTTTGGCAGAGAGCCAGCTGCTG 
CCATCTCAAGGCCCAGGGCAGATCTCCCTGCTGAGGAGCCGGCGCCCAGCACTCCTCCATGTCTGGTGCA 
GGCAGAAGAGGAGGCTGTGTATGAGGAACCTCCAGAGCAGGAGACCTTCTACGAGCAGCCCCCACTGGTG 
CAGCAGCAAGGTGCTGGCTCTGAGCACATTGACCACCACATTCAGGGCCAGGGGCTCAGTGGGCAAGGGC 
TCTGTGCCCGTGCCCTGTACGACTACCAGGCAGCCGACGACACAGAGATCTCCTTTGACCCCGAGAACCT 
CATCACGGGCATCGAGGTGATCGACGAAGGCTGGTGGCGTGGCTATGGGCCGGATGGCCATTTTGGCATG 
TTCCCTGCCAACTACGTGGAGCTCATTGAGTGA 

Human HIP-55 mRNA sequence - var4 (public gi: 10121214) 

GGGGCGGGCCATGGCGGCGAACCTGAGCCGGAACGGGCCAGCGCTGCAAGAGGCCTACGTGCGGGTGGTC 
ACCGAGAAGTCCCCGACCGACTGGGCTCTCTTTACCTATGAAGGCAACAGCAATGACATCCGCGTGGCTG 
GCACAGGGGAGGGTGGCCTGGAGGAGATGGTGGAGGAGCTCAACAGCGGGAAGGTGATGTACGCCTTCTG 
CAGAGTGAAGGACCCCAACTCTGGACTGCCCAAATTTGTTCTCATCAACTGGACAGGCGAGGGCGTGAAC 
GATGTGCGGAAGGGAGCCTGTTCCAGCCACGTCAGCACCATGGCCAGCTTCCTGAAGGGGGCCCATGTGA 
CCATCAACGCACGGGCCGAGGAGGATGTGGAGCCTGAGTGCATCATGGAGAAGGTGGCCAAGGCTTCAGG 
TGCCAACTACAGCTTTCACAAGGAGAGTGGCCGCTTCCAGGACGTGGGACCCCAGGCCCCAGTGGGCTCT 
GTGTACCAGAAGACCAATGCCGTGTCTGAGATTAAAAGGGTTGGTAAAGACAGCTTCTGGGCCAAAGCAG 
AGAAGGAGGAGGAGAACCGTCGGCTGGAGGAAAAGCGGCGGGCCGAGGAGGCACAGCGGCAGCTGGAGCA 
GGAGCGCCGGGAGCGTGAGCTGCGTGAGGCTGCACGCCGGGAGCAGCGCTATCAGGAGCAGGGTGGCGAG 
GCCAGCCCCCAGAGTACGTGGGAGCAGCAGCAAGAAGTGGTTTCAAGGAACCGAAATGAGCAGGAGTCTG 
CCGTGCACCCGAGGGAGATTTTCAAGCAGAAGGAGAGGGCCATGTCCACCACCTCCATCTCCAGTCCTCA 
GCCTGGCAAGCTGAGGAGCCCCTTCCTGCAGAAGCAGCTCACCCAACCAGAGACCCACTTTGGCAGAGAG 
CCAGCTGCTGCCATCTCAAGGCCCAGGGCAGATCTCCCTGCTGAGGAGCCGGCGCCCAGCACTCCTCCAT 
GTCTGGTGCAGGCAGAAGAGGAGGCTGTGTATGAGGAACCTCCAGAGCAGGAGACCTTCTACGAGCAGCC 
CCCACTGGTGCAGCAGCAAGGTGCTGGCTCTGAGCACATTGACCACCACATTCAGGGCCAGGGGCTCAGT 
GGGCAAGGGCTCTGTGCCCGTGCCCTGTACGACTACCAGGCAGCCGACGACACAGAGATCTCCTTTGACC 
CCGAGAACCTCATCACGGGCATCGAGGTGATCGACGAAGGCTGGTGGCGTGGCTATGGGCCGGATGGCCA 
TTTTGGCATGTTCCCTGCCAACTACGTGGAGCTCATTGAGTGAGGCTGAGGGCACATCTTGCCCTTCCCC 
TCTCAGACATGGCTTCCTTATTGCTGGAAGAGGAGGCCTGGGAGTTGACATTCAGCACTCTTCCAGGAAT 
AGGACCCCCAGTGAGGATGAGGCCTCAGGGCTCCCTCCGGCTTGGCAGACTCAGCCTGTCACCCCAAATG 
CAGCAATGGCCTGGTGATTCCCACACATCCTTCCTGCATCCCCCGACCCTCCCAGACAGCTTGGCTCTTG 
CCCCTGACAGGATACTGAGCCAAGCCCTGCCTGTGGCCAAGCCCTGAGTGGCCACTGCCAAGCTGCGGGG 

TCTTGCTTCTAAGGGGTGGTGGCCACCACTGTTTAGAATGACCCTTGGGAACAGTGAACGTAGAGAATTG 
TTTTTAGCAGAGTTTGTGACCAAAGTCAGAGTGGATCATGGTGGTTTGGCAGCAGGGAATTTGTCTTGTT 
GGAGCCTGCTCTGTGCTCCCCACTCCATTTCTCTGTCCCTCTGCCTGGGCTATGGGAAGTGGGGATGCAG 
ATGGCCAAGCTCCCACCCTGGGTATTCAAAAACGGCAGACACAACATGTTCCTCCACGCGGCTCGCTCGA 
TGCCTGCAGGCCCCAGTGTGTGCCTCAACTGATTCTGACTTCAGGAAAAGTAACACAGAGTGGCCTTGGC 
CTGTTGTCTTCCCCTATTTTCTGTCCCAGCTCATCCGTGTCTCTGAAGAATAAATATGCTTTTGGAAAAA 
AAAAAAAAAA 

Human HIP-55 mRNA sequence - var5 (public gi: 10441969) 

GACCATCAACGCACGGGCCGAGGAGGATGTGGAGCCTGAGTGCATCATGGAGAAGGTGGCCAAGGCTTCA 
GGTGCCAACTACAGCTTTCACAAGGAGAGTGGCCGCTTCCAGGACGTGGGACCCCAGGCCCCAGTGGGCT 
CTGTGTACCAGAAGACCAATGCCGTGTCTGAGATTAAAAGGGTTGGTAAAGACAGCTTCTGGGCCAAAGC 
AGAGAAGGAGGAGGAGAACCGTCGGCTGGAGGAAAAGCGGCGGGCCGAGGAGGCACAGCGGCAGCTGGAG 
CAGGAGCGCCGGGAGCGTGAGCTGCGTGAGGCTGCACGCCGGGAGCAGCGCTATCAGGAGCAGGGTGGCG 
AGGCCAGCCCCCAAAGGACGTGGGAGCAGCAGCAAGAAGTGGTTTCAAGGAACCGAAATGAGCAGGAGTC 
TGCCGTGCACCCGAGGGAGATTTTCAAGCAGAAGGAGAGGGCCATGTCCACCACCTCCATCTCCAGTCCT 
CAGCCTGGCAAGCTGAGGAGCCCCTTCCTGCAGAAGCAGCTCACCCAACCAGAGACCCACTTTGGCAGAG 
AGCCAGCTGCTGCCATCTCAAGGCCCAGGGCAGATCTCCCTGCTGAGGAGCCGGCGCCCAGCACTCCTCC 
ATGTCTGGTGCAGGCAGAAGAGGAGGCTGTGTATGAGGAACCTCCAGAGCAGGAGACCTTCTACGAGCAG 
CCCCCACTGGTGCAGCAGCAAGGTGCTGGCTCTGAGCACATTGACCACCACATTCAGGGCCAGGGGCTCA 
GTGGGCAAGGGCTCTGTGCCCGTGCCCTGTACGACTACCAGGCAGCCGACGACACAGAGATCTCCTTTGA 
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CCCCGAGAACCTCATCACGGGCATCGAGGTGATCGACGAAGGCTGGTGGCGTGGCTATGGGCCGGATGGC 
CATTTTGGCATGTTCCCTGCCAACTACGTGGAGCTCATTGAGTGAGGCTGAGGGCACATCTTGCCCTTCC 
CCTCTCAGACATGGCTTCCTTATTGCTGGAAGAGGAGGCCTGGGAGTTGACATTCAGCACTCTTCCAGGA 
ATAGGACCCCCAGTGAGGATGAGGCCTCAGGGCTCCCTCCGGCTTGGCAGACTCAGCCTGTCACCCCAAA 
TGCAGCAATGGCCTGGTGATTCCCACACATCCTTCCTGCATCCCCCGACCCTCCCAGACAGCTTGGCTCT 
TGCCCCTGACAGGATACTGAGCCAAGCCCTGCCTGTGGCCAAGCCCTGAGTGGCCACTGCCAAGCTGCGG 
GGAAGGGTCCTGAGCAGGGGCATCTGGGAGGCTCTGGCTGCCTTCTGCATTTATTTGCCTTTTTTCTTTT 
TCTCTTGCTTCTAAGGGGTGGTGGCCACCACTGTTTAGAATGACCCTTGGGAACAGTGAACGTAGAGAAT 
TGTTTTTAGCAGAGTTTGTGACCAAAGTCAGAGTGGATCATGGTGGTTTGGCAGCAGGGAATTTGTCTTG 
TTGGAGCCTGCTCTGTGCTCCCCACTCCATTTCTCTGTCCCTCTGCCTGGGCTATGGGAAGTGGGGATGC 
AGATGGCCAAGCTCCCACCCTGGGTATTCAAAAACGGCAGACACAACATGTTCCTCCACGCGGCTCACTC 
GATGCCTGCAGGCCCCAGTGTGTGCCTCAACTGATTCTGACTTCAGGAAAAGTAACACAGAGTGGCCTTG 
GCCTGTTGTCTTCCCCTATTTTCTGTCCCAGCTCATCCGTGTCTCTGAAGAACAAATATGCTTTTGGACC 
ACGAAAAAAAAAAAAAAAAAAAAA 

Human HIP-55 mRNA sequence - var6 (public gi: 14041995) 

AGCGGCGCGGAGACTGCGGGGCGGGCCATGGCGGCGAACCTGAGCCGGAACGGGCCAGCGCTGCAAGAGG 
CCTACGTGCGGGTGGTCACCGAGAAGTCCCCGACCGACTGGGCTCTCTTTACCTATGAAGGCAACAGCAA 
TGACATCCGCGTGGCTGGCACAGGGGAGGGTGGCCTGGAGGAGATGGTGGAGGAGCTCAACAGCGGGAAG 
GTGATGTACGCCTTCTGCAGAGTGAAGGACCCCAACTCTGGACTGCCCAAATTTGTCCTCATCAACTGGA 
CAGGCGAGGGCGTGAACGATGTGCGGAAGGGAGCCTGTGCCAGCCACGTCAGCACCATGGCCAGCTTCCT 
GAAGGGGGCCCATGTGACCATCAACGCACGGGCCGAGGAGGATGTGGAGCCTGAGTGCATCATGGAGAAG 
GTGGCCAAGGCTTCAGGTGCCAACTACAGCTTCCACAAGGAGAGTGGCCGCTTCCAGGACGTGGGACCCC 
AGGCCCCAGTGGGCTCTGTGTACCAGAAGACCAATGCCGTGTCTGAGATTAAAAGGGTTGGTAAAGACAG 
CTTCTGGGCCAAAGCAGAGAAGGAGGAGGAGAACCGTCGGCTGGAGGAAAAGCGGCGGGCCGAGGAGGCA 
CAGCGGCAGCTGGAGCAGGAGCGCCGGGAGCGTGAGCTGCGTGAGGCTGCACGCCGGGAGCAGCGCTATC 
AGGAGCAGGGTGGCGAGGCCAGCCCCCAGAGCAGGACGTGGGAGCAGCAGCAAGAAGTGGTTTCAAGGAA 
CCGAAATGAGCAGGGGTCAACATGTGCTTCCCTCCAGGAGTCTGCCGTGCACCCGAGGGAGATTTTCAAG 
CAGAAGGAGAGGGCCATGTCCACCACCTCCATCTCCAGTCCTCAGCCTGGCAAGCTGAGGAGCCCCTTCC 
TGCAGAAGCAGCTCACCCAACCAGAGACCCACTTTGGCAGAGAGCCAGCTGCTGCCATCTCAAGGCCCAG 
GGCAGATCTCCCTGCTGAGGAGCCGGCGCCCAGCACTCCTCCATGTCTGGTGCAGGCAGAAGAGGAGGCT 
GTGTATGAGGAACCTCCAGAGCAGGAGACCTTCTACGAGCAGCCCCCACTGGTGCAGCAGCAAGGTGCTG 
GCTCTGAGCACATTGACCACCACATCCAGGGCCAGGGGCTCAGTGGGCAAGGGCTCTGTGCCCGTGCCCT 
GTACGACTACCAGGCAGCCGACGACACAGAGATCTCCTTTGACCCCGAGAACCTCATCACGGGCATCGAG 
GTGATCGACGAAGGCTGGTGGCGTGGCTATGGGCCGGATGGCCATTTTGGCATGTTCCCTGCCAACTACG 
TGGAGCTCATTGAGTGAGGCTGAGGGCACATCTTGCCCTTCCCCTCTCAGACATGGCTTCCTTATTGCTG 
GAAGAGGAGGCCTGGGAGTTGACATTCAGCACTCTTCCAGGAATAGGACCCCCAGTGAGGATGAGGCCTC 
AGGGCTCCCTCCGGCTTGGCAGACTCAGCCTGTCACCCCAAATGCAGCAATGGCCTGGTGATTCCCACAC 
ATCCTTCCTGCATCCCCCGACCCTCCCAGACAGCTTGGCTCTTGCCCCTGACAGGATACTGAGCCAAGCC 
CTGCCTGTGGCCAAGCCCTGAGTGGCCACTGCCAAGCTGCGGGGAAGGGTCCTGAGCAGGGGCATCTGGG 
AGGCTCTGGCTGCCTTCTGCATTTATTTGCCTTTTTTCTTTTTCTCTTGCTTCTAAGGGGTGGTGGCCAC 
CACTGTTTAGAATGACCCTTGGGAACAGTGAACGTAGAGAATTGTTTTTAGCAGAGTTTGTGACCAAAGT 
CAGAGTGGATCATGGTGGTTTGGCAGCAGGGAATTTGTCTTGTTGGAGCCTGCTCTGTGCTCCCCACTCC 
ATTTCTCTGTCCCTCTGCCTGGGCTATGGGAAGTGGGGATGCAGATGGCCAAGCTCCCACCCTGGGTATT 
CAAAAACGGCAGACACAACATGTTCCTCCACGCGGCTCACTCGATGCCTGCAGGCCCCAGTGTGTGCCTC 
AACCGATTCTGACTTCAGGAAAAGTAACACAGAGTGGC 

Human HIP-55 mRNA sequence- var7 (public gi: 15079722) 

GGCACGAGGGCGGAGACTGCGGGGCGGGCCATGGCGGCGAACCTGAGCCGGAACGGGCCAGCGCTGCAAG 
AGGCCTACGTGCGGGTGGTCACCGAGAAGTCCCCGACCGACTGGGCTCTCTTTACCTATGAAGGCAACAG 
CAATGACATCCGCGTGGCTGGCACAGGGGAGGGTGGCCTGGAGGAGATGGTGGAGGAGCTCAACAGCGGG 
AAGGTGATGTACGCCTTCTGCAGAGTGAAGGACCCCAACTCTGGACTGCCCAAATTTGTCCTCATCAACT 
GGACAGGCGAGGGCGTGAACGATGTGCGGAAGGGAGCCTGTGCCAGCCACGTCAGCACCATGGCCAGCTT 
CCTGAAGGGGGCCCATGTGACCATCAACGCACGGGCCGAGGAGGATGTGGAGCCTGAGTGCATCATGGAG 
AAGGTGGCCAAGGCTTCAGGTGCCAACTACAGCTTTCACAAGGAGAGTGGCCGCTTCCAGGACGTGGGAC 
CCCAGGCCCCAGTGGGCTCTGTGTACCAGAAGACCAATGCCGTGTCTGAGATTAAAAGGGTTGGTAAAGA 
CAGCTTCTGGGCCAAAGCAGAGAAGGAGGAGGAGAACCGTCGGCTGGAGGAAAAGCGGCGGGCCGAGGAG 
GCACAGCGGCAGCTGGAGCAGGAGCGCCGGGAGCGTGAGCTGCGTGAGGCTGCACGCCGGGAGCAGCGCT 
ATCAGGAGCAGGGTGGCGAGGCCAGCCCCCAGAGCAGGACGTGGGAGCAGCAGCAAGAAGTGGTTTCAAG 
GAACCGAAATGAGCAGGAGTCTGCCGTGCACCCGAGGGAGATTTTCAAGCAGAAGGAGAGGGCCATGTCC 
ACCACCTCCATCTCCAGTCCTCAGCCTGGCAAGCTGAGGAGCCCCTTCCTGCAGAAGCAGCTCACCCAAC 
CAGAGACCCACTTTGGCAGAGAGCCAGCTGCTGCCATCTCAAGGCCCAGGGCAGATCTCCCTGCTGAGGA 
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GCCGGCGCCCAGCACTCCTCCATGTCTGGTGCAGGCAGAAGAGGAGGCTGTGTATGAGGAACCTCCAGAG 
CAGGAGACCTTCTACGAGCAGCCCCCACTGGTGCAGCAGCAAGGTGCTGGCTCTGAGCACATTGACCACC 
ACATTCAGGGCCAGGGGCTCAGTGGGCAAGGGCTCTGTGCCCGTGCCCTGTACGACTACCAGGCAGCCGA 
CGACACAGAGATCTCCTTTGACCCCGAGAACCTCATCACGGGCATCGAGGTGATCGACGAAGGCTGGTGG 
CGTGGCTATGGGCCGGATGGCCATTTTGGCATGTTCCCTGCCAACTACGTGGAGCTCATTGAGTGAGGCT 
GAGGGCACATCTTGCCCTTCCCCTCTCAGACATGGCTTCCTTATTGCTGGAAGAGGAGGCCTGGGAGTTG 
ACATTCAGCACTCTTCCAGGAATAGGACCCCCAGTGAGGATGAGGCCTCAGGGCTCCCTCCGGCTTGGCA 
GACTCAGCCTGTCACCCCAAATGCAGCAATGGCCTGGTGATTCCCACACATCCTTCCTGCATCCCCCGAC 
CCTCCCAGACAGCTTGGCTCTTGCCCCTGACAGGATACTGAGCCAAGCCCTGCCTGTGGCCAAGCCCTGA 
GTGGCCACTGCCAAGCTGCGGGGAAGGGTCCTGAGCAGGGGCATCTGGGAGGCTCTGGCTGCCTTCTGCA 
TTTATTTGCCTTTTTTCTTTTTCTCTTGCTTCTAAGGGGTGGTGGCCACCACTGTTTAGAATGACCCTTG 
GGAACAGTGAACGTAGAGAATTGTTTTTAGCAGAGTTTGTGACCAAAGTCAGAGTGGATCATGGTGGTTT 
GGCAGCAGGGAATTTGTCTTGTTGGAGCCTGCTCTGTGCTCCCCACTCCATTTCTCTGTCCCTCTGCCTG 
GGCTATGGGAAGTGGGGATGCAGATGGCCAAGCTCCCACCCTGGGTATTCAAAAACGGCAGACACAACAT 
GTTCCTCCACGCGGCTCACTCGATGCCTGCAGGCCCCAGTGTGTGCCTCAACTGATTCTGACTTCAGGAA 
AAGTAACACAGAGTGGCCTTGGCCTGTTGTCTTCCCCTATTTTCTGTCCCAGCTCATCCGTGTCTCTGAA 
GAACAAATATGCTTTTGGACCACGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 

Human HIP-55 mRNA sequence - var8 (public gi: 21619482) 

CGGGCCATGGCGGCGAACCTGAGCCGGAACGGGCCAGCGCTGCAAGAGGCCTACGTGCGGGTGGTCACCG 
AGAAGTCCCCGACCGACTGGGCTCTCTTTACCTATGAAGGCAACAGCAATGACATCCGCGTGGCTGGCAC 
AGGGGAGGGTGGCCTGGAGGAGATGGTGGAGGAGCTCAACAGCGGGAAGGTGATGTACGCCTTCTGCAGA 
GTGAAGGACCCCAACTCTGGACTGCCCAAATTTGTCCTCATCAACTGGACAGGCGAGGGCGTGAACGATG 
TGCGGAAGGGAGCCTGTGCCAGCCACGTCAGCACCATGGCCAGCTTCCTGAAGGGGGCCCATGTGACCAT 
CAACGCACGGGCCGAGGAGGATGTGGAGCCTGAGTGCATCATGGAGAAGGTGGCCAAGGCTTCAGGTGCC 
AACTACAGCTTTCACAAGGAGAGTGGCCGCTTCCAGGACGTGGGACCCCAGGCCCCAGTGGGCTCTGTGT 
ACCAGAAGACCAATGCCGTGTCTGAGATTAAAAGGGTTGGTAAAGACAGCTTCTGGGCCAAAGCAGAGAA 
GGAGGAGGAGAACCGTCGGCTGGAGGAAAAGCGGCGGGCCGAGGAGGCACAGCGGCAGCTGGAGCAGGAG 
CGCCGGGAGCGTGAGCTGCGTGAGGCTGCACGCCGGGAGCAGCGCTATCAGGAGCAGGGTGGCGAGGCCA 
GCCCCCAGAGGACGTGGGAGCAGCAGCAAGAAGTGGTTTCAAGGAACCGAAATGAGCAGGAGTCTGCCGT 
GCACCCGAGGGAGATTTTCAAGCAGAAGGAGAGGGCCATGTCCACCACCTCCATCTCCAGTCCTCAGCCT 
GGCAAGCTGAGGAGCCCCTTCCTGCAGAAGCAGCTCACCCAACCAGAGACCCACTTTGGCAGAGAGCCAG 
CTGCTGCCATCTCAAGGCCCAGGGCAGATCTCCCTGCTGAGGAGCCGGCGCCCAGCACTCCTCCATGTCT 
GGTGCAGGCAGAAGAGGAGGCTGTGTATGAGGAACCTCCAGAGCAGGAGACCTTCTACGAGCAGCCCCCA 
CTGGTGCAGCAGCAAGGTGCTGGCTCTGAGCACATTGACCACCACATTCAGGGCCAGGGGCTCAGTGGGC 
AAGGGCTCTGTGCCCGTGCCCTGTACGACTACCAGGCAGCCGACGACACAGAGATCTCCTTTGACCCCGA 
GAACCTCATCACGGGCATCGAGGTGATCGACGAAGGCTGGTGGCGTGGCTATGGGCCGGATGGCCATTTT 
GGCATGTTCCCTGCCAACTACGTGGAGCTCATTGAGTGAGGCTGAGGGCACATCTTGCCCTTCCCCTCTC 
AGACATGGCTTCCTTATTGCTGGAAGAGGAGGCCTGGGAGTTGACATTCAGCACTCTTCCAGGAATAGGA 
CCCCCAGTGAGGATGAGGCCTCAGGGCTCCCTCCGGCTTGGCAGACTCAGCCTGTCACCCCAAATGCAGC 
AATGGCCTGGTGATTCCCACACATCCTTCCTGCATCCCCCGACCCTCCCAGACAGCTTGGCTCTTGCCCC 
TGACAGGATACTGAGCCAAGCCCTGCCTGTGGCCAAGCCCTGAGTGGCCACTGCCAAGCTGCGGGGAAGG 
GTCCTGAGCAGGGGCATTTGGGAGGCTCTGGCTGCCTTCTGCATTTATTTGCCTTTTTTCTTTTTCTCTT 
GCTTCTAAGGGGTGGTGGCCACCACTGTTTAGAATGACCCTTGGGAACAGTGAACGTAGAGAATTGTTTT 
TAGCAGAGTTTGTGACCAAAGTCAGAGTGGATCATGGTGGTTTGGCAGCAGGGAATTTGTCTTGTTGGAG 
CCTGCTCTGTGCTCCCCACTCCATTTTTCTGTCCCTCTGCCTGGGCTGTGGGAAGTGGGGATGCAGATGG 
CCAAGCTCCCCCCCTGGGTATTCAAAAACGGCAGACACAACATGTTCCTCCACGCGGCTCACTCGATGCC 
TGCAGGCCCCAGTGTGTGCCTCAACTGATTCTGACTTCAGGAAAAGTAACACAGAGTGGCCTTGGCCTGT 
TGTCTTCCCCTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 

Human HIP-55 mRNA sequence - var9 (public gi: 23959038) 

GGCACGAGGATTTGACACATGAATGTATAGCAGTCATTGGGAAACTCCACAGCTCATGTTTTCCTCATAG 
TAGATGTGTGCTCCCATCTCCATGGCTTTGTCCCTCACAACCCCCACCCCATGGTAAGTCAGGCCAGTGT 
CCTCCCAGCTGCAGAGCTGAGAAGGCTGCACAGTTGCCTACTGAGAACCTGCCTAGTGGGTCAGAGCAAA 
GTGAGAACGGGCCTGTGCCCACCCACAGTGTTACTGTCAGCCCAAGCTCTTTGGGATGTAGTGGAAAGTC 
ATGGTGGATACGGTGAGGAGAGATGGAACCCAAGGTGCTGGCTACAGAGCTCACTTGTGTTTCGTTTCAG 
GGCTCTCTTTACCTATGAAGGCAACAGCAATGACATCCGCGTGGCTGGCACAGGGGGTGAGTATGACTCC 
AAATGGACTCAGGGACACCAGGAGGTAGGAGGGTGACGACGAGGGGTCAGCGCACTCAGCTGTCTTGGTC 
CACTGAGCCACATGGGGCTTCCAGTGCTCACTGGCCACTTCTGGCAGGCCTTAGGTTTCAGATATGTGTA 
AGTGAAAACATTCCTCCTTGGTTCTCCTTCCCTCTGGGTGCAGGGGAGTGCTTTCTCTTTGTCTACTTGG 
GGAGAGCTGAGAGGGAAACAGGCCTCTCCAGCTTGTGGGCAGCCTGCGTTGGGAGCTGCGGTGGGAAGCT 
CACCAGTCCCAGAACTGGTGCTGGTGGAAAGAAAGTCCACAGACATATCTTCTTCTCCCTTTGTCCTGCC 
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CTGGTCTTGTGCCGAGTGCTTGCAGGGGCCCCATCCTCACTGGGAGAGGCAGTATCACTGCAGATAGTCA 
CGGGGGAGGCTCTGGAGGTCTCTACAGGAAGGACAGGCTCTTGGCCAGCACAGAGCAGAGGTTGTCAGGG 
TAGGCTTCGTCAGAGTGTGACCTGTGGGCCCCTCAGCTGACACCCGTGACTGCTCCTCCTCCAGAAGTTG 
CCTGACCCCTCCCTCTGTCCTGAGCTGGACATGGCTTCATTGTTCAATGAACACTCGGAGTGGTTCTCCA 
CGGTTTGATGTCTGTTGTTGGTAGAAAGCCCCTTCCTTTCACAATCTTTCTGGGAGGTGTCCCCTTTCTA 
GAAGGATTGCCATTGAACAGTAGACATGTGGTGTGGCAGGTGACTGGGAGTTGCAGAGATCAACAACTTG 
AGAGTTTCCTGTCATCCCCAGTGGCACAGGACAGGGCTCTGCCACAAATGCAACAATTTGCTGTCCCCAG 
AGTGGGGCTCATGACTGCCTCCACTCATACGGAGCCCTGTAGATGAAATACCTGATCAGCTCTTCCTCCT 
TATAACCTGGAAAAGTTTGTGAGGGCTAAGCCTCAGTGTCAGGGAGAATTGTTTAGAGCTGCCCACTCCT 
GTGCTCCCCCTGTCCCCATCACCCTCTCTTCTGGAGTCTGAGGACTGAGCCAGTTACGCCACTGCAGGAT 
GTTCAATCTGGTCTGGCCGTCTGGGTGGCCCTGGAACTTGAGCAGACACAGGTGCAGGCAGTGGTGACTC 
TACAGGCCCTGCTATTCCGGGCCCTTTTGCAACGTTGTGGCAACAATAAAATTTTGACGTAGCCATCCTC 
CATTTGGAAGTCTGGTGGCTGGTTTGCCGTGGAAATGACCCTGTTTTTATTTCCAGAATTACCTCTGGGT 
TTAGAGAAGTGGTTTTTAAACGAGTGTGGGTAAAAAAATTACCTGAGGTACTTGTCAGAATCGCAGACTT 
CTAGGTCCCACCCAGCTCTCATCAATCAGTTTAGTGAGGGTGGTGCCCAGGACTCTGATTTTAAACATAC 
CCCTAGAAAGATTCTGATACAGGTAGAGGTGAGAAGCCCTGGTTTAGAAGCAGCTCGGCCTCCCTTCATG 
GTGGGACCAGGGCCAGCAGGGAATGTCAGGGCCACCCCTGACCTTCACTGTGACTCTGCTGCAGAGGGTG 
GCCTGGAGGAGATGGTGGAGGAGCTCAACAGCGGGAAGGTGATGTACGCCTTCTGCAGAGTGAAGGACCC 
CAACTCTGGACTGCCCAAATTTGTCCTCATCAACTGGACAGGCGAGGGCGTGAACGATGTGCGGAAGGGA 
GCCTGTGCCAGCCACGTCAGCACCATGGCCAGCTTCCTGAAGGGGGCCCATGTGACCATCAACGCACGGG 
CCGAGGAGGATGTGGAGCCTGAGTGCATCATGGAGAAGGTGGCCAAGGCTTCAGGTGCCAACTACAGCTT 
TCACAAGGAGAGTGGCCGCTTCCAGGACGTGGGACCCCAGGCCCCAGTGGGCTCTGTGTACCAGAAGACC 
AATGCCGTGTCTGAGATTAAAAGGGTTGGTAAAGACAGCTTCTGGGCCAAAGCAGAGGTGAGTGCTGCCC 
CGGGGCATGCTGGGCACGTGGGAGTGTTCTGCTTGCTGTGGCTCATCTTTCCTCACAAGTGAGCTCATGC 
AGCATCCACTCTCCTTGGTGCCCATTACAGATGGTCACACTGAGGCTCGGGTAAGTTAAGCCACAAGGCT 
AATGATCGACTGGCTCTGGTGCCCGTCTTTGGCCATGTGCCTAAAACTCAGTCCTGGGCAGGGGATTAGG 
CTGAAGTGGCAGCATAGGGCTGAGCGGGCAGTGGCTCTCCCTGCAGAAGGAGGAGGAGAACCGTCGGCTG 
GAGGAAAAGCGGCGGGCCGAGGAGGCACAGCGGCAGCTGGAGCAGGAGCGCCGGGAGCGTGAGCTGCGTG 
AGGCTGCACGCCGGGAGCAGCGCTATCAGGAGCAGGGTGGCGAGGCCAGCCCCCAGAGGACGTGGGAGCA 
GCAGCAAGAAGTGGTTTCAAGGAACCGAAATGAGCAGGAGTCTGCCGTGCACCCGAGGGAGATTTTCAAG 
CAGAAGGAGAGGGCCATGTCCACCACCTCCATCTCCAGTCCTCAGCCTGGCAAGCTGAGGAGCCCCTTCC 
TGCAGAAGCAGCTCACCCAACCAGAGACCCACTTTGGCAGAGAGCCAGCTGCTGCCATCTCAAGGCCCAG 
GGCAGATCTCCCTGCTGAGGAGCCGGCGCCCAGCACTCCTCCATGTCTGGTGCAGGCAGAAGAGGAGGCT 
GTGTATGAGGAACCTCCAGAGCAGGAGACCTTCTACGAGCAGCCCCCACTGGTGCAGCAGCAAGGTGCTG 
GCTCTGAGCACATTGACCACCACATTCAGGGCCAGGGGCTCAGTGGGCAAGGGCTCTGTGCCCGTGCCCT 
GTACGACTACCAGGCAGCCGACGACACAGAGATCTCCTTTGACCCCGAGAACCTCATCACGGGCATCGAG 
GTGATCGACGAAGGCTGGTGGCGTGGCTATGGGCCGGATGGCCATTTTGGCATGTTCCCTGCCAACTACG 
TGGAGCTCATTGAGTGAGGCTGAGGGCACATCTTGCCCTTCCCCTCTCAGACATGGCTTCCTTATTGCTG 
GAAGAGGAGGCCTGGGAGTTGACATTCAGCACTCTTCCAGGAATAGGACCCCCAGTGAGGATGAGGCCTC 
AGGGCTCCCTCCGGCTTGGCAGACTCAGCCTGTCACCCCAAATGCAGCAATGGCCTGGTGATTCCCACAC 
ATCCTTCCTGCATCCCCCGACCCTCCCAGACAGCTTGGCTCTTGCCCCTGACAGGATACTGAGCCAAGCC 
CTGCCTGTGGCCAAGCCCTGAGTGGCCACTGCCAAGCTGCGGGGAAGGGTCCTGAGCAGGGGCATCTGGG 
AGGCTCTGGCTGCCTTCTGCATTTATTTGCCTTTTTTCTTTTTCTCTTGCTTCTAAGGGGTGGTGGCCAC 
CACTGTTTAGAATGACCCTTGGGAACAGTGAACGTAGAGAATTGTTTTTAGCAGAGTTTGTGACCAAAGT 
CAGAGTGGATCATGGTGGTTTGGCAGCAGGGAATTTGTCTTGTTGGAGCCTGCTCTGTGCTCCCCACTCC 
ATTTCTCTGTCCCTCTGCCTGGGCTATGGGAAGTGGGGATGCAGATGGCCAAGCTCCCACCCTGGGTATT 
CAAAAACGGCAGACACAACATGTTCCTCCACGCGGCTCACTCGATGCCTGCAGGCCCCAGTGTGTGCCTC 
AACTGATTCTGACTTCAGGAAAAGTAACACAGAGTGGCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 
AAAAAAAAAAA 

Human HIP-55 protein sequence - varl (public gi: 21619483) 

MAANLSRNGPALQEAWRWTEKSPTDWALFTYEGNSNDIRVAGTGEGGLEEMVEELNSGKVMYAFCRVK 
DPNSGLPKFVLINWTGEGVNDVRKGACASHVSTMASFLKGAHVTINARAEEDVEPECIMEKVAKASGANY 
SFHKESGRFQDVGPQAPVGSVYQKTNAVSEIKRVGKDSFWAKAEKEEENRRLEEKRRAEEAQRQLEQERR 
ERELREAARREQRYQEQGGEASPQRTWEQQQEWSRNRNEQESAVHPREIFKQKERAMSTTSISSPQPGK 
LRSPFLQKQLTQPETHFGREPAAAISRPRADLPAEEPAPSTPPCLVQAEEEAVYEEPPEQETFYEQPPLV 
QQQGAGS EH I DHH I QGQGLSGQGLCARALYD YQAADDTE I S FDPENL I TG I E VI DEGWWRGYGPDGHFGM 
FPANYVELIE 

Human HIP-55 protein sequence - var2 (public gi: 15079723) 

MAANLSRNGPALQEAWRWTEKSPTDWALFTYEGNSKTOIRVAGTGEGGLEE1WEELNSGKVMYAFCRVK 
DPNSGLPKFVLINWTGEGVNDVRKGACASHVSTMASFLKGAHVTINARAEEDVEPECIMEKVAKASGANY 
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S FHKESGRFQDVGPQAPVGSVYQKTNAVSE I KRVGKDS FWAKAEKEEENRRLEEKRRAEEAQRQLEQERR 
ERELREAARREQRYQEQGGEASPQSRTWEQQQEWSRNRNEQESAVHPREIFKQKERAMSTTSISSPQPG 
KLRSPFLQKQLTQPETHFGREPAAAISRPRADLPAEEPAPSTPPCLVQAEEEAVYEEPPEQETFYEQPPL 
VQQQGAGSEHIDHHIQGQGLSGQGLCARALYDYQAADDTEISFDPENLITGIEVIDEGWWRGYGPDGHFG 
MFPANYVELIE 

Human HIP-55 protein sequence - var3 (public gi: 14041996) 

MAANLSRNGPALQEAYVRVVTEKSPTDWALFTYEGNSNDIRVAGTGEGGLEE^EELNSGKVMYAFCRVK 

DPNSGLPKFVLINWTGEGVNDVRKGACASHVSTMASFLKGAHVTINARAEEDVEPECIMEKV 

S FHKESGRFQDVGPQAPVGSVYQKTNAVSE I KRVGKDS FWAKAEKEEENRRLEEKRRAEEAQRQLEQERR 

ERELREAARREQRYQEQGGEASPQSRTWEQQQEWSRNRNEQGSTCASLQESAVHPREIFKQKERAMSTT 

SISSPQPGKLRSPFLQKQLTQPETHFGREPAAAISRPRADLPAEEPAPSTPPCLVQAEEEAVYEEPPEQE 

TFYEQPPLVQQQGAGSEHIDHHIQGQGLSGQGLCARALYDYQAADDTEISFDPENLITGIEVIDEGWWRG 

YGPDGHFGMFPANYVELIE 

Human HIP-55 protein sequence - var4 (public gi: 10441970) 

MEKVAKASGANYS FHKESGRFQDVGPQAPVGSVYQKTNAVSE I KRVGKDS FWAKAEKEEENRRLEEKRRA 
EEAQRQLEQERRERELREAARREQRYQEQGGEAS PQRTWEQQQE WSRNRNEQESAVHPRE I FKQKERAM 
STTSISSPQPGKLRSPFLQKQLTQPETHFGREPAAAISRPRADLPAEEPAPSTPPCLVQAEEEAVYEEPP 
EQETFYEQPPLVQQQGAGSEHIDHHIQGQGLSGQGLCARALYDYQAADDTEISFDPENLITGIEVIDEGW 
WRG YGPDGH FGM F P ANYVEL I E 

Human HIP-55 protein sequence - var5 (public gi: 10121215) 

MAANLSRNGPALQEAYVRWTEKS PTDWALFTYEGNSNDI RVAGTGEGGLEEMVEELNSGKVMYAFCRVK 
DPNSGLPKFVLINWTGEGVNDVRKGACSSHVSTl^SFLKGAHVTINARAEEDVEPECIMEKVAKASGANY 
S FHKESGRFQDVGPQAPVGSVYQKTNAVSE I KRVGKDS FWAKAEKEEENRRLEEKRRAEEAQRQLEQERR 
ERELREAARREQRYQEQGGEAS PQSTWEQQQEWSRNRNEQES AVHPRE I FKQKERAMSTTS I S SPQPGK 
LRSPFLQKQLTQPETHFGREPAAAISRPRADLPAEEPAPSTPPCLVQAEEEAVYEEPPEQETFYEQPPLV 
QQQGAGS EH I DHH I QGQGLSGQGLCARALYD YQAADDTE I S FDPENL I TGI E VI DEGWWRGYGPDGHFGM 
FPANYVELIE 
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